2022.05/17 重回帰分析(3)
重回帰分析で求められた重回帰式に説明変数を多く入れると重回帰式の目的変数に対する寄与率は上がるが、汎用性が無くなるので好ましくない、とよく言われる。
これは、舌足らずな説明である。説明変数が少なくても重回帰式に採用された説明変数間の相関が高ければ、汎用性が無くなる。汎用性の高いモデル式とするためには、説明変数間の一次独立が重要である。
説明変数間で相関が高い時には、相関のある説明変数において一方の説明変数は他方の説明変数を用いて一次式を組み立てることが可能、すなわち相関のある説明変数のどちらかが重回帰式に取り込まれておればよい。
相関のある説明変数を両方取り込んだ重回帰式で、この説明変数に相関から外れた値を入れたときには誤差が多く取り込まれている結果で予測することになる。
しかし、重回帰式を組み立てるときにすべての説明変数を従属性の無い一次独立のデータとすることは容易ではない。
40年以上前にホウ酸エステルとリン酸エステルの組み合わせ難燃化システムを発明した時に上司から組み合わせ効果を数値で示すように指示された。
アカデミアよりもアカデミックな研究を要求されるような研究所だったが、残念なのは指示を出している上司が内容を理解せず指示を出している場合が多く大変だった。
この苦労のおかげで企業の研究所で学位をとれるほど育つことができたのだが、コーチングというよりもガマの油を搾りだしているような指導だった。
重回帰分析で示すアイデアまで浮かんだのだが、当時リン酸エステル系難燃剤には塩素が含まれており、塩素の効果を取り除いて評価しなければいけない問題が生じた。
そこで、塩素だけの難燃剤やリンだけの難燃剤についてもデータを収集してリンと塩素の相関係数を下げる努力をした。結局50件をこす実験を行いデータを集めることになった。
努力が実り、リンと塩素の相関を下げることができ、リンとホウ素の組み合わせ効果をうまく説明できる重回帰式を組み上げることができた。
今ならばタグチメソッドでL18実験を行う。ただ、当時実験計画法も行ってリンとホウ素の組み合わせ効果を確認していたのだが、上司が統計手法を充分に理解していなかったのでその説明は却下された。
データサイエンスは当時先端手法で人間の頭によるマテリアルインフォマティクスを研究しているグループもあったが、合成グループの主任研究員は数学に弱かった。今の時代は、多変量解析ぐらいは専門外でも身に着けておきたい。
カテゴリー : 未分類
pagetop