2023.02/16 データサイエンスによる問題解決(1)
データサイエンスとは、データ群に隠れている情報を統計手法なり、機械学習により抽出する「技」である。ゆえに対象となる問題(正しい問題が選ばれているという前提)をどのように捉えるかにより、手法を選択する必要がある。
大別すれば、回帰か分類となるが、それぞれについて多変量解析による方法や機械学習による方法など多数存在する。また、機械学習を選択したならば、どのようなアルゴリズムとするのかを考える必要がある。
機械学習でも単純に回帰問題を解かせるAIをプログラミングできるが、すこし込み入った問題であれば、ベイズ推定などを持ち出すことになる。
材料開発に限れば50年の経験から、多変量解析はまず自由に使えるようにしておいた方が良いと思っている。ほとんどの問題が重回帰分析や主成分分析、あるいはその組み合わせで解ける。
それゆえ弊社はそれに使用するソフトウェアーを無料公開している。次に実験を計画的に行いたいならば、タグチメソッド(TM)を習得しておくと毎度便利である。当方はTMを習得してから、それを使わずに材料開発した経験は皆無である。
TMについで便利な手法に「ナンチャッテインフォマティクス」がある。ラテン方格をテキトーに使ったり、現象の相関に着目し、データマイニングする方法である。特にプログラミングスキルは必要ではない。
データサイエンスとは、その「技」を研究する目的においては科学であるが、問題解決に使用する観点においては、「技」である。ディープラーニングを用いても目標とする「モノ」すなわち実体を創造できなければ意味が無い。
「ナンチャッテインフォマティクス」ではアジャイル開発を行うので必ず「モノ」ができる。この意味で大変優れた方法である。あみだくじ方式を用いたiPS細胞の発明も同類である。研究開発が「千三つ」と言われた時代は昔のことである。DXの進展で技術者の「技」次第の時代となった。
当方は30年以上前に、科学の方法で「解決できない」と否定証明された電気粘性流体の耐久性問題をデータサイエンスにより、一晩で「解決できる」という結論を示し、実体を完成している。それだけでなく傾斜機能粉体など創造し、その結果ゴム会社から写真会社へ転職することになった。
DXの進展でデータサイエンスが技術開発の当たり前の手法となって、当方のような悲劇は過去の出来事になったが、データサイエンスを材料開発の科学的方法と誤って指導する光景が現れたので当時とは異なる心配をしている。
カテゴリー : 一般
pagetop