2013.10/31 重回帰分析について
重回帰分析は、2変数の単回帰分析が実務でよく使われているので説明の必要は無いかもしれないが簡単に概略を述べる。
サンプリングされた2種類のデータ群、xとyの2変数の間の関係を求めるためにx軸とy軸の平面にデータ(x,y)の組をプロットする。そしてある一次式y=ax+bの直線のまわりにそのプロットが集まっていると、この二変数の間に相関がある、と仮定する。そして相関係数を求め相関の度合いを評価したり、求められた一次式から目的変数の推定値を求めたり、その推定値とサンプリングされたデータからのズレを評価したりして解析を進める。
この時、xを説明変数、yを目的変数と呼び、この分析方法を単回帰分析という。解析の結果、二変数の間に強い相関がありその相関を説明できる仮説がほぼ正しいと判明すると、一次式は現象の予測式として使えるようになる。現象を予測し、誤差分析を繰り返しながら真実に迫っていくのが単回帰分析の手法である。
単回帰分析に対して重回帰分析とは、その説明変数が多くなった回帰分析のことで、多変量解析の中ではよく使われている。重回帰分析で使用される重回帰式のyを目的変数といい、xを説明変数と呼ぶのは単回帰分析と同じである。そして目的変数を多数の説明変数の一次式の関数として求め解析を進める方法もほぼ同様であるが、ここで一次式である点を忘れてはいけない。
さらに気をつけなければいけないのは、説明変数を多数導入すると重回帰式の信頼度は上がるが、その結果お互いに相関のある説明変数を取り込む問題が出てくる。説明変数の間の相関が高くなると目的変数に対する説明変数の寄与を正しく評価できなくなる。説明変数の目的変数に対する寄与を標準偏回帰係数で求めるときに、各説明変数の間に相関が無く(これを一次独立という)信頼度が高い重回帰式が理想ですが、そのような重回帰式を組み立てられる場合は稀である。高い相関のある説明変数が取り込まれたときの重回帰式は目的変数に対する説明変数の寄与を求めるときには注意が必要である。
説明変数間に高い相関があり、どうしても全ての説明変数を入れた重回帰式を組み立てたい場合には、主成分分析と組み合わせて重回帰式を求める。すなわち説明変数について主成分分析を行うと一次独立の変数に変換できるので、この変換された新たな変数を説明変数として重回帰式を組み立てる。この手法にはコンピューターが不可欠である。
あるいは、説明変数を減らしても良い場合には、相関の強い説明変数のどちらかを棄却して重回帰分析を行う。これを自動的に行う方法もあり、段階式重回帰分析と呼ばれている。段階式重回帰分析では、一つづつ説明変数を取り込むときに説明変数の相関を評価している。技術開発では説明変数に対してある程度の重要度が決まっている場合が多いので段階式重回帰分析はあまり使用されない。
説明変数間の相関が低い重回帰式が得られたなら標準偏回帰係数(偏微分)を用いて目的変数に対する説明変数の寄与を調べる。ここで標準偏回帰係数を用いるのは単なる偏回帰係数では説明変数の単位にその値が影響を受けるので、用いることができないから。
このほか残渣分析を用いて回帰式がどの程度サンプル集団の説明ができるのか調べる手順は単回帰分析の時と同様である。昨日まで説明した主成分分析に比較して重回帰分析は単回帰分析に似ているので親しみやすい多変量解析手法である。
pagetop