2023.09/17 データで考えるとは?
この10年第3次AIブームで、日本のアカデミアではマテリアルズインフォマティクスが流行している。しかし、これは科学としてはキワモノで、40年以上前は忌み嫌われた手法だった。
しかし当方はその手法の将来性、すなわちコンピューターが普及し誰でもそれを問題解決に利用する時代になると期待した。
すなわち50年近くマテリアルズインフォマティクスを研究に用いてきたわけだが、データで考える、という意味をよく理解していない人が多いことに早くから気がついた。
当方が転職する原因となった電気粘性流体の耐久性問題では、優秀なスタッフが1年かけて否定証明を展開している。彼らは、まさにデータをもとに否定証明を展開していたわけだが、それらのデータは仮説に基づき集められたものだ。
ところがデータサイエンスで問題解決する時のデータは、このような仮説に基づき集められたデータでなくてもよい。すなわち、何か現象から取り出されたデータがあればそれらを学習機械にかけて問題解決のヒントを得ることができる。
当方は40年近く前に、電気粘性流体の耐久性問題について、界面活性剤のカタログデータをMZ80Kに打ち込み、データサイエンスで処理して解決策を見出し、一晩でこの問題を解決している。
この時のデータは、当方の実験データでもなければ、誰かが仮説に基づき集めたデータでもない、公知のカタログデータである。
それを用いてデータサイエンスにより結論を出したことが非科学的だと電気粘性流体のリーダーから非難され、非難されただけでなく、その後壮絶なハラスメントを受けることになった。
それを隠蔽化する方針が研究所で出されたので、命を惜しみ転職している(注)。データサイエンスで問題解決することが命がけであった時代である。
データで考える、という時のデータは、科学の世界では仮説に基づくデータとなるが、仮説によらない現象を記述したデータを用いて考えても問題解決できるが、これは非科学的方法となる。
ところが非科学的方法ではあるが、データサイエンスを活用してデータで考えることが、コンピューターの普及で当たり前の時代になったのである。
今コンピューターリテラシーが進歩したので、データサイエンスで問題解決してもハラスメントを受けるようなことはないと思う。
ただし、そのためにはデータ処理方法の科学的知識が求められる。知識は科学的であるが、知識を活用する過程が非科学となるのがマテリアルズインフォマティクスである。しかし、今やこれも科学と呼ぶ時代になった。哲学者イムレラカトシュは科学と非科学の境界は時代ともともに変わると指摘しているとおりだ。
(注)当時このテーマに関わった3人の若手研究者が次々と退職している。転職後それぞれと面会しドラマが展開するのだが、企業内の悪人に対してそれが刑事事件となるような問題でも隠蔽化されれば被害者は常にハラスメントにさらされることになる。ゆえに自殺するサラリーマンが出てくる背景になっているのだが、命だけは大切にしたい。それに耐えれば出世できる、とアドバイスしてくれた人がいるが、ナイフが机に刺さっていたりしたら命の心配をする。インターネットを調べていただければ、その後の壮絶な事件が出てくるが。
カテゴリー : 一般
pagetop