2023.05/07 ビッグデータは不要
データサイエンスでアイデアを練ったり、新材料を創造するために、ビッグデータは不要である。高純度SiCでは、フェノール樹脂を1t以上廃棄処理する必要もあって、廃棄作業をやりながらたくさんデータを収集できた。
また、PPSベルトでは、実験を行わずシミュレーションで多数のデータを出してデータサイエンスしている。そして、配合を変更しなくても高次構造の制御で目標を実現できることを見出した。
しかし、最低3個程度でも大丈夫な分野がある。興味のあるかたは弊社のセミナーを受講していただきたいが、データサイエンスを用いて材料開発を行ったり、製品開発を行ったりする方法は、20世紀の視点では非科学的方法である。
どうせ非科学的方法ならば、と割りきれば、データの数など気にせず、データサイエンスによりヒューリスティックに結論を迅速に導き出せるメリットを享受したくなる。
その時、データサイエンス活用方法のコツを知っているかどうかは重要である。例えば、重回帰分析でp値やt値が問題にされたりする。これらの値は、データ量が多くなれば小さくなる傾向にあり、ビッグデータではt検定に容易に合格する。
ところがt検定に合格したからといって寄与率が高くなっていない場合もあるから注意する必要がある。逆に、重回帰分析では寄与率の高い式が得られたならp値など気にしなくてよい。寄与率の高さからアイデアを迅速にまとめることがコツである。
データサイエンスを実務に用いる場合、科学としての厳密性にこだわるよりも、技術として有益な成果が得られるかどうかの視点で活用するのがコツである。
カテゴリー : 一般
pagetop