2022.05/14 重回帰分析(1)
マテリアルインフォマティクスがアカデミアから提案があり、データサイエンスに注目が集まっている。材料開発に積極的に取りこもうという動きが出てきたが、その中心のツールとなる多変量解析の手法は、1975年ごろに日科技連から新QC7つ道具として提案された手法で、特に新しい手法ではない。
当時は8ビットマイコンが発明され、秋葉原にその評価キットが出始めた時代であり、多変量解析のソフトなど一般に普及していなかった。
ゴム会社ではIBM3033の大型コンピューターの統計パッケージに多変量解析のソフトウェアーが用意されており、1980年前後に人の頭脳によるマテリアルインフォマティクスがすでに研究されていた。
乳化重合SBRのデザインやタイヤ軽量化設計、防振ゴム材料設計、ポリウレタンやフェノール樹脂発泡体の設計などに成果がでていた。電気粘性流体の耐久性問題では、その問題解決に主成分分析が使われ、高偏差値のスタッフ数名が1年以上かけて否定証明した研究の成果を一晩でひっくり返すほどの成果が出ている。
当方は入社当初はIBM3033にお世話になったが、データサイエンスについて研究所上司の理解が得られず、MZ80KとFDOS、フロッピーシステムを自前で揃えて多変量解析のソフトを組んで、独身寮で楽しんでいた(マテリアルインフォマティクスのようなデータサイエンスは、数学が好きな研究者には楽しみのための研究である。材料を創り出すことが好きな研究者が楽しんで初めて有益なツールとなる)。
MZ80Kは30万円以下だったが、システムを揃えたところ軽自動車1台あるいは最も安価な誰も買わないクラスのカローラ程度の価格だった。
この出費で年収150万円前後という当時の給与では、1年間休日は独身寮に籠る生活を余儀なくされたが、そのおかげで勉強時間とテニスの時間を十分に取れた(独身寮におれば食事には困らなかった。ご飯や梅干し、漬物は食べ放題だった。給与の半分は書籍代はじめ知識関係の出費になっていた。学術書は研究所の図書費で購入できたが、上司の許可が必要だったので自費で購入していた。当時購入した多変量解析の書籍は洋書も含め6冊ほどあった。)。
ところで、重回帰分析では、得られる重回帰式の2つ以上の説明変数間において、相関の無いことが重要である。
数学的に表現すると説明変数が一次独立であることが求められる。データサイエンスが普及し、パソコンで多変量解析が手軽にできるようになったが、データ整理に便利な重回帰分析の有効性を見出せない原因の一つにこの基本が十分理解されていない点にあるのではないかと思っている。(明日に続く)
カテゴリー : 未分類
pagetop