PLSってどのくらい使えるのか?

Partial Least Squares(PLS; 部分最小二乗法,偏最小二乗法)ってどのくらい使えるのか,あまりまとまった解説がなかったので,Rで遊びながら確かめてみました.

教材:PLSって使えるの?

  1. PLSは$(Xu)’Yv$を最大化するように $u^*$ と$v^*$ を決める.
  2. この$u^*$と$v^*$は,$X’Y$の特異値分解から得られる.
  3. 推定の考え方がOLSとは違うので,$X$と$Y$にかく乱項が加わった場合,係数の不偏性は怪しい.
  4. PLSの実際の利用は,多数の変数を持つ$X$から$Y$の説明力の高い$X$の主成分を抽出し,それと相関の高い$X$を特定すること.
  5. 変数間の係数に関心がある場合は,PLSで特定した$X$でPCRをするのがよさそう.
  6. 実際のPLSは,$X’Y$の特異値分解という単純なものでなく,主成分を1つずつ算出していく複雑なアルゴリズムが複数ある.
  7. Rのパッケージplsにあるplsr()関数で出力される$Y$のスコア(Yscores)は$X$のスコアに合わせてスケールを調整しているので要注意.

おすすめ