2026.04/04 データ駆動の落とし穴
科学の時代の研究開発は、仮説設定から始まる、これは論理学が完成し科学が成立した時代にマッハが語った言葉である。ところが、オブジェクト指向が浸透し、データオブジェクトの有効性を知った技術が仮説設定せずデータ駆動で研究開発を始めた。
今やデータ駆動の方法をAIの方法と勘違いしている人がいる。確かに現代の生成系AIはデータ駆動で動作している。しかし、データ駆動の方法は、グラフ用紙一枚でもできるのである。
早期退職制度を利用し55歳で退職しようとしたところ、役員から安い環境対応樹脂を開発してくれ、データを公開しても良いから、と言われて、2010年にデータ駆動で中国ローカル企業を指導し、射出成形可能な再生PET樹脂を開発している。
データを公開しても良いから、と言われて、それが動機となって開発したからデータ駆動、としゃれているわけではない。マテリアルズインフォマティクスが日本で注目されていない50年ほど前から研究してきた当方は、グラフ用紙1枚でデータ駆動による実験を行い、3カ月で新たなポリマーアロイを開発している。
最近、このデータ駆動の方法をAIと組み合わせて、大量のデータをAIに判断させ、材料開発をしようという流行があるが、あくまでも内挿による推定となることに気がついて欲しい。
分かり易く言うと、難燃性樹脂を開発するにあたり、空気中で自己消火性にもなっていない樹脂のデータを集めて、自己消火性の樹脂をAIに考えさせる、といった外挿的な開発は難しいのである。
偶然できることもあるかもしれない。ベイズ統計の世界では、起こりうる可能性があるのだが、高分子の難燃化には、ある一定の条件がそろわない限り、期待される難燃性樹脂を開発できないのだ。
すなわち、そのある一定条件の一つが欠けた状態のデータを大量に集めて最良の難燃性樹脂を開発することなどできないのである。
このような問題を克服する方法も、実はあるが、それはまだ公開されていない。すなわちこの方法そのものが特許になるのでご興味のあるかたは問い合わせて頂きたい。4月13日の技術情報協会のセミナーではヒントを少し話す。
カテゴリー : 一般
pagetop
