問題
被説明変数が0,1,2,3,程度の回数をとる場合、ポアソン回帰という方法を使う必要があります。前回の中古車の取引データd01.csvに、新たに修理回数(fix.csv)というデータが見つかりました。この修理回数を、d01のデータを使って説明しなさい。
データは以下にあります。
- fix.csvをfixという名前でRに読み込んで、前回作成したデータフレームd01にくっつけなさい。
- fixのヒストグラムを描きなさい。
- fixを被説明変数、d01の各変数を説明変数としてポアソン回帰をしなさい。
- 最適なモデルを選択しなさい。
R Tips
d01,d02,d03の複数のデータフレームを束ねて、d01という新しいデータフレームをつくる。
d01<-data.frame(d01,d02,d03)
cbindを使うこともできます。これはデータフレームだけでなく行列(matrix)でも使えます。
d01<-cbind(d01,d02,d03)
ちなみにrbindは、行を追加する場合。
d01<-rbind(d01,d02)
ヒストグラムはベクトルxのhistという関数で描くことができます。
hist(x)
ポアソン回帰にはglmという関数を使います。yが回数、x1、x2、x3が被説明変数の場合、
glm(y~x1+x2+x3,family=poisson)
で計測できます。lmと同じように、すべての変数を説明変数とする場合は、y~. などとすることができるし、結果に対して、AIC, update,predict などを適用することができます。