2022.05/15 重回帰分析(2)
重回帰分析では、得られる重回帰式の2つ以上の説明変数間において、相関の無いことが重要である。数学的に表現すると説明変数が一次独立であることが求められる。
データサイエンスが普及し、パソコンで多変量解析が手軽にできるようになったが、データ整理に便利な重回帰分析の有効性を見出せない原因の一つにこの基本が十分理解されていない点があるのではないかと思っている。
説明変数間で全く相関が無い時に導かれた重回帰式のある説明変数αの偏回帰係数は、その説明変数α1個と目的変数で導かれる1次回帰式における単相関係数と一致する。
このことから説明変数間に相関がある場合の重回帰式の問題を理解できる。そもそも説明変数間に相関があれば、その相関のある説明変数どおしで単相関の一次式を組むことが可能である。
すなわち、相関のある二つの説明変数のいずれか一つが重回帰式に組み込まれておればよいことを意味するとともに、それら二つの説明変数を組み込んだ場合には、二つの説明変数間の相関から外れた値を入力して重回帰式で推定した時に誤差を抱え込むことになる。
重回帰式で説明変数を多くするとその式の相関係数は上がるが、予測式として使えない式になる、と説明されたりしているが、これは不十分な説明である。説明変数が少ない重回帰式でも、その式に含まれる説明変数間に相関が高ければ、予測式として説明変数に入力する値によっては誤差が大きくなる。
カテゴリー : 一般
pagetop