2024.03/15 データサイエンスの効果的活用法(3)
重回帰分析と主成分分析を理解するだけで、日々の仕事のやり方が変わる、というよりも、科学の視点だけでなく技術の視点で現象を眺めることができるようになる。
大量のデータを処理する目的として、回帰あるいは分類の2種類が考えられる。分類では、分類されたものを均等に扱う方法から、好ましい順に分類する方法があり、技術開発では好ましい因子を見出したい場合が多いので、分散の大きい順に分類を行う主成分分析がよく用いられる。
回帰では、多数の説明変数を用いて目的変数を説明する重回帰分析が用いられ、各説明変数が一次従属であることが強く求められる時には、段階式重回帰分析を使用する。しかし、技術開発では、その技術に必要とされる説明変数を採用したいので、説明変数間の相関係数を見ながら技術者が選ぶ方法が良い。
50年近く前は、多変量解析ぐらいしかなかったが、今ならば深層学習により回帰や分類のプログラムを容易に開発することができ、この方法が流行している。ただし、現象を一次回帰で説明できるならば、多変量解析の方が早く結論を出せる。
Pythonでプログラミングすれば重回帰分析の場合に数行でプログラミングできるだけでなく、弊社のサイトを使えば、エクセルのデータ表を貼り付けるだけで答えを出せる。
とにかく、こうしたデータサイエンスの手法を自由に使えれば、時々この欄に書いている、電気粘性流体の耐久性問題を完璧な否定証明するような、科学一色で染まった偏りのある頭脳とは異なるアイデアを出すことができるようになる。
すなわち、仮説ではなく、データ駆動で現象を眺めようとする習慣が身につく。これが大切である。仮説を立てる習慣は、小学校からの教育で身についているが、データを中心に考える習慣は、意外にもできない人がいる。
これは科学の弊害だと思っている。データを現象の鏡として見るのではなく、自分の仮説の視点だけで見ようとする人がいる。そして、仮説に合わなければ(注)データに屁理屈をつけて否定証明に持ち込む。STAP細胞の事件でも明らかとなったように、このような科学に毒された人は多い。
(注)実験の失敗から思いがけない発見をする経験を重ねると、仮説に合わない実験データも重要であることに気がつく。この実験の失敗による発見の逸話をどのように人生の学びとするかは、研究者により異なる。弟子のアチソンがSiCを偶然合成できた実験を成果としただけでなく、その製造法にアチソン法と名付けたエジソンの偉大さは、今更説明する必要はないだろう。最近の話では、白川先生のポリアセチレンやヤマナカファクターとして名前が残った山中先生の実験の逸話がある。仮説に合わなければ、残業させてでも仮説に合う実験データを求める姿勢が美化される研究所は、今更コメントしないが、このような研究所のゴム会社でもタイヤ開発部隊は研究所と異なる現物現場主義であるところが面白い。世界一のタイヤ技術の会社になれた所以だろう。研究所は世界初のLi二次電池の実用化を行ってもノーベル賞を取れていない。電気粘性流体も世界初の実用的な防振システムやアクティブサスの開発を行っても事業の継続ができていない。当方が0から企画し住友金属工業とのJVとして立ち上げた高純度SiC半導体治工具事業は、30年近くゴム会社で事業が行われ現在は愛知県のセラミックス企業で継承されている。いずれのテーマにも当方は関わっているが、0から企画し事業を立ち上げるまで関わった高純度SiCの技術だけ、今でも事業として残っている。なぜこの事業がこれほど成功したのかは問い合わせていただきたい。事業として成功する必然があった。当方も事業として成功させるためにFD事件の早期収束のため被害者でありながら転職の道を選んでいる。転職後も当方は技術サポートのため1年近く研究所へ定期的に通っていた。このあたりの状況は一部関係者の手紙が残っているのでいつか公開したいと考えている。事業というものは誠実真摯に遂行しなければ成功しないのである。
カテゴリー : 一般
pagetop