#2ポアソン回帰

問題

被説明変数が0,1,2,3,程度の回数をとる場合、ポアソン回帰という方法を使う必要があります。前回の中古車の取引データd01.csvに、新たに修理回数(fix.csv)というデータが見つかりました。この修理回数を、d01のデータを使って説明しなさい。

データは以下にあります。

fix.csv

  1. fix.csvをfixという名前でRに読み込んで、前回作成したデータフレームd01にくっつけなさい。
  2. fixのヒストグラムを描きなさい。
  3. fixを被説明変数、d01の各変数を説明変数としてポアソン回帰をしなさい。
  4. 最適なモデルを選択しなさい。

R Tips

d01,d02,d03の複数のデータフレームを束ねて、d01という新しいデータフレームをつくる。

d01<-data.frame(d01,d02,d03)

cbindを使うこともできます。これはデータフレームだけでなく行列(matrix)でも使えます。

d01<-cbind(d01,d02,d03)

ちなみにrbindは、行を追加する場合。

d01<-rbind(d01,d02)

ヒストグラムはベクトルxのhistという関数で描くことができます。

hist(x)

ポアソン回帰にはglmという関数を使います。yが回数、x1、x2、x3が被説明変数の場合、

glm(y~x1+x2+x3,family=poisson)

で計測できます。lmと同じように、すべての変数を説明変数とする場合は、y~. などとすることができるし、結果に対して、AIC, update,predict などを適用することができます。

おすすめ