新材料開発を行う時に一番心配なことは、情報が少ない中で特異点を見落とすことである。これを理解していない人が多い。特異点があってもロバストが高いとは限らない、とか、特異点を見落としても実用的なものができればよいとか思っている人がいる。
確かにそれらの意見にも一理あるが、特異点の存在を知らずに実用化した時に、ライバルから性能が高い特異点の領域で特許を出されると大変である。
ゆえに、上手な実験のやり方として、まず開発領域を明確にすることから始めることをお勧めする。これは故田口玄一先生の言葉で表現すれば、システム設計を行い基本機能を明確にする、ということだ。
そして、システム設計を行うためにタグチメソッド(TM)で実験を行うことになる。ところが、システム設計がうまくできない場合も出てくる。その時は、システム設計を行うための実験を行うことになる。
この時にも直交表を使うと良い。直交表を使うのだが、TM実験のように大掛かりに行う必要はない。システム設計できたなら改めてTM実験を行い、調整因子で最適化を行う、というのが従来の実験方法である。
10年ほど前からベイズ最適化の手法がもてはやされているが、ベイズ最適化がいつも最適であると限らない。昔ながらのTMによる最適化で十分な場合がある。
ベイズ最適化実験を行う時でも、最初にL8かL9程度の直交表でTMを行うことをお勧めする。これにより、特異点の存在を伺い知ることができる。数個実験を行って、ベイズ最適化で攻めても最適点に到達できるが、特異点の不安が残る。
1980年代にコンビナトリアルケミストリーが流行ったのは、新素材が思いもよらぬ条件で見出されたりしたからである。この20年ほどは驚くような新発見はiPS細胞くらいなので、全部の条件で実験を行うというのは野暮に思われるかもしれない。
ベイズ統計を用いるプログラムが身近にあれば、それを少し手直しして誰でもベイズ最適化ができる時代である。しかし、この半世紀に様々な実験方法が開発されてきた。山中博士のあみだくじ方式には驚いたが、良いものができれば、それでもノーベル賞である。
実験のやり方、戦略や戦術の立て方は重要で、弊社はそれを販売してきた。中国では、小さなローカル企業が大きくなるという成果が出たが、日本では全然販売実績が無いのが寂しい。
TMが日本に普及し始めた90年代にも似た空気がベイズ最適化にも感じられる。AIとの親和性もありこれからどんどん発展するのだろうけれど、これまでの実験方法が悪いわけではない。目的や戦況に応じた実験方法を選択するのが正しい。
カテゴリー : 一般
pagetop
直交表を用いてデータ駆動による材料開発を50年近く行ってきたが、コンビナトリアルケミストリーより効率が良いことを発見している。
この10年近くベイズ最適化に取り組んできたが、オーバーフィッティングが起きると正確な予測が困難になる。ベイズ最適化では、TMや実験計画法のように線形性の無い現象でもモデリング可能であるが、仮に線形性があってもオーバーフィッティングが起きる。
これは、実験計画法やTMの要因効果図で変曲点が現れたりする現象と同じである。実験計画法では要因効果図に線形性が無くても解析可能と指導しているが、材料開発に適用するときに、これが最適点を外す原因となる。
面白いのは、TMの要因効果図でも線形性が崩れ、多次元モデルとして扱った方が良い場合が出てくるがTMでは最適点を外さない工夫を指導される。また、欠損値の扱いも明快である。
ベイズ最適化でもAIとして用いるモデルを充分に吟味し評価すれば多少のペナルティーを防ぐことができるが、TMほどではない。TMでは確認実験がベイズ最適化における回帰モデル評価に相当するのかもしれないが、実際に実験を行っているので説得力がある。
一方ベイズ最適化でオーバーフィッティングの問題が起きたりするので、線形性が存在する現象では、AIとして用いるモデル構築の手法は重回帰分析で十分である。
直交表を用いる時にせよ。ベイズ最適化を行う時にせよ、正しくその手法を理解していないと、自分の無知を手法の責任にしたりする。その点、TMは、手法を理解すれば実験者を裏切ることは無い易しい実験手法である。
カテゴリー : 一般
pagetop
直交表を用いる実験といえば、実験計画法である。しかし、実験計画法で材料開発を行うと、最適点が外れることがある。これには50年近く前にゴム会社の研修(日科技連BASICコース)で痛い目にあっている。
研究所では統計手法を業務に導入するのはアホと陰口を言われていた。面白いことにタイヤ開発の基礎研究所ではすでに多変量解析はじめ当時の先端の統計手法が使われていたのに、コーポレートの研究所ではそれが否定されたのだ。
ただ、実験計画法で痛い目にあってみると、研究所の陰口にも納得できたりした。しかし、会社が一人50万円もかけて研修を行っているのだ。業務に導入しないのはおかしい、と思い、実験計画法の研究を趣味で行っている。
これも研究所でいじめられる原因となったのだが、最適点を外すと周囲によく笑われた。嘲笑を受けながら工夫して、直交表の外側に相関係数を割り付けると、最適点が外れないことを発見した。
これは、タグチメソッド(TM)で直交表の外側にSN比を配置する手法と類似である。TMでは、誤差因子も外側に配置して実験を行うが、TMを実験計画法と呼んではいけない、と故田口玄一先生はいつも言われていた。
TMは統計手法ではないのだ。例えば感度は相関係数に似たような性質だがTMの感度は相関係数そのものではない。また、感度も含むSN比は標準偏差と異なるTM独自の指標である。
すなわち、TMでは直交表を用いるが、それゆえ実験計画法と誤解される、と田口先生は嘆かれていたのだ。このお気持ちはよく理解できた。当方も実験計画法で嘲笑を受け、相関係数を外側に割り付ける手法を編み出しているので、その手法が実験計画法ではないように感じていたからである。
カテゴリー : 一般
pagetop
いつの時代でも効率的な実験のやり方が求められている。なぜなら、研究開発の費用に直接影響するからである。直交表を用いる実験計画法は古くから用いられてきた実績のある方法だ。
しかし、最適条件が外れる場合がある。タグチメソッドでも直交表を用いるが、こちらはへまな実験を行わない限り最適条件が外れない。ここでへまな実験とは、故田口先生が言われていた基本機能の選択や制御因子について先生の教えを守らない場合である。
データサイエンスの普及で、実験モデルを組み立て実験する方法が新たに登場した。ベイズ最適化がその例であるが、いつもこの方法が効率が良いとは限らない。
また、実験モデルの組み立てにいわゆる回帰モデルなどが使われたりするが、このモデリングにおいて説明変数をうまく選ばないと、実験に失敗する場合がある。
実験モデルをプログラムコードで書けばAIとして使えるので今時の流行なのだろうが、モデリングで失敗すると良い結果を導けない。
自動化が可能な方法であるが、自動化が必要ない時には、アナログ的なモデリングも試してみると良い。グラフ用紙を用いて行うが、意外と有効な方法であることに気づく。実験条件は直交表を用いて決めると良い。
カテゴリー : 一般
pagetop
Pythonが普及し、誰でもデータ解析をコンピューターさえあれば無料で行える環境が整備された。このような時代になると、データをどのように管理したらよいのか、という問題が出てくる。
来週月曜日に技術情報協会で開催される「Excel業務をPythonで置き換えるデータ解析の実践」では、生成系AIの普及を踏まえた幅広い講義内容で構成している。
すなわち、今の研究開発業務をDXにふさわしいやり方に変革しようとしたときに、まず生成系AIについて正しく理解しなければいけない。次にこの生成系AIを生み出した、データ駆動という概念とオブジェクト指向という概念を学ばなければいけない。
もちろんデータ解析にはPythonの習得が必須であるが、PythonだけでなくR言語に関しても知識が必須である。Pythonを駆使できればR言語はいらないように思われるかもしれないが、エクセルファイルを使ったデータ解析にはR言語が手軽である。
PythonでもPADASをimportし、statsmodelsを活用すればR言語の内容をおおよそカバーできる。しかし、R言語の変数でベクトルを使うことができる便利さは、それでも生み出されない。
R言語を必要ない、と言われる人もいるが、Pythonの中でR言語を記述できることを知ると、知識として持っていた方が便利なことに気がつく。
この他に今の研究開発シーンで技術者が一通り知識として持っていた方が良いことを盛り込んだセミナーであり、おそらく他に例のない内容だと自負している。
カテゴリー : 一般
pagetop
ベイズ最適化の手法が普及し始めたのではないだろうか。雰囲気として90年代のタグチメソッド普及の時のような空気感がある。
ベイズ最適化は、配合設計のような組み合わせと量の最適化問題を解くときに便利である。数点の実験データから最適点の確率の高い条件を見つけ実験し、外れればそのデータをモデルに組み入れ再度計画を練ってゴールを見出すデータ駆動の方法である。
AIによる自動化も可能である。最初にモデルを組み立てる時に過去データを用いて行うこともできるので、従来のようにエクセルにデータを貯めていては不便な時がある。
可能ならば、実験データは一つのデータベースに保存した方が便利で、その点に着眼しFAIR原則が10年前に定められた。
データ駆動の時代にデータの再利用の重要性に気づき、環境が整備されつつある。この状況に着眼し、弊社では特許出願を行い、エクセルに代わる新しいデータ整理用のツールを開発した。
さて、弊社のソフトウェアーを使用すればデータ管理の方法も今の時代にふさわしくなるが、それでもベイズ最適化の方法には落とし穴が残ってくる。
実験を効率的に行う方法として、実験計画法が古くから使われてきた。そしてこの方法の問題を解決するためにタグチメソッド(TM)が登場している。残念ながらTMは日本で普及せず、アメリカでまず故田口先生は大成功を収める。
この時日本ではコンビナトリアルケミストリー(CS)が流行している。セレンディピティーなる言葉ももてはやされ、CS用の実験装置も開発された。
CSは、すべての条件を検討するので、特異点の存在を見落とさない。実験計画法やTMも対象としている系のモデリングには因子の水準の振り方を間違えなければ落とし穴に落ちない。
しかし、ベイズ最適化には、特異点が存在しない、という前提に注意しないといけない。ベイズ最適化は確かに効率が良いが、それは特異点が存在しないという条件においてである。
以前この欄にデータ駆動によりPETボトルのリサイクル樹脂を開発した話を書いている。この実験ではベイズ最適化を用いていない。PETに5種類の樹脂やゴムをカオス混合し、PETが主成分となるポリマーアロイを目標としたが、直交表を用いている。
すなわち、最初にL9を用いた9種類の配合実験を行い、ポリマーアロイの引張試験や曲げ試験におけるふるまいを観察整理している。この9種類の配合系の試験で延性脆性転移や、延性破壊をする高靭性のポリマーアロイを発見している。
オブジェクト指向におけるふるまいから考察すると、3種類のポリマーアロイができることになる。しかし、L9実験で得られた結果からはその規則性を示すデータは得られなかった。
そこで、次のL9実験ではちちんぷいぷいとおまじないをした配合系で検討したところ、高靭性高強度のポリマーアロイを開発でき、驚くべきことに老化防止剤等耐久性に関わる添加剤を添加していないにもかかわらず、15年間窓際においてもこの性質が失われていない。
このような、特異点の材料を見出すには、データ駆動の方法が便利であるが、その時にベイズ最適化が良いとは限らない。なぜ、80年代にセレンディピティーなる言葉が流行し、CSが生み出されたのか知っている人は、ベイズ最適化の問題点にすぐ気づくはずである。
カテゴリー : 一般
pagetop
5年以上国内樹脂トップメーカーの配合組成をそのままに当方が開発したコンパウンドと餃子の餡が似ているので以前今回のタイトルで3回ほど書いている。
昨日のデータ駆動を分かり易く説明するために、再度同じタイトルで書いてみる。餃子の餡にひき肉は必須である。ひき肉の入っていない餃子を形が同じなら餃子の仲間に入れる人もいるかもしれないが、ここではそれを除外する。
最近人造肉と本物の肉が区別でいないくらいに技術が進歩してきたので、このような定義はつまらないかもしれない。しかし、話の都合で、本物の肉が入っている餃子だけを餃子として扱う。
このような餃子の定義で、人造肉で餃子を作れるのか、という問題を考えてみる。今なら、本物の餃子と間違えるような餃子ができるかもしれない。しかし、本物の肉と明らかに区別される人造肉を使って、本物の餃子と間違えるような餃子を作ることができるのか、という問題を考えてみる。
まず、この問題の答えを述べればできるのである。実際にオカラを豚の背油で処理して味付けした材料で成功している。しかし、豚の背油を用いているので、完全に本物の肉を使っていない、とは言いにくい。
サラダ油とかいろいろ試したが、おいしい餃子とはならなかった。すなわち手元にある油を使っていたのでは、いくらAIを使用してデータ駆動で開発しようとしてもおいしい餃子を開発できないことを理解できるのではないか。
同様に、カオス混合技術を用いないで歩留まりの良いPPS中間転写ベルト用コンパウンドを製造することは困難である。仮にできたとしても、隠れたWパーコレーション転移制御というコンセプトをもちいない限り、従来の低い歩留まりを超えるコンパウンドなどデータ駆動とAIを結び付けても開発できないのだ。
当方はWパーコレーション転移制御とカオス混合という世界初のコンセプトを組み合わせて、歩留まりが100%近い押出成形を可能とする技術を開発したのである。しかも樹脂メーカーの開発した配合組成を変えないでそれを実現している。
結果だけを見れば、データ駆動xAIでできそうに見えるが、国内トップメーカーのコンパウンドを用いている限り、当方の達成した歩留まりまで到達することはできない。近づくことはできるかもしれないが、超えることはできない。
カテゴリー : 一般
pagetop
科学の時代の研究開発は、仮説設定から始まる、これは論理学が完成し科学が成立した時代にマッハが語った言葉である。ところが、オブジェクト指向が浸透し、データオブジェクトの有効性を知った技術が仮説設定せずデータ駆動で研究開発を始めた。
今やデータ駆動の方法をAIの方法と勘違いしている人がいる。確かに現代の生成系AIはデータ駆動で動作している。しかし、データ駆動の方法は、グラフ用紙一枚でもできるのである。
早期退職制度を利用し55歳で退職しようとしたところ、役員から安い環境対応樹脂を開発してくれ、データを公開しても良いから、と言われて、2010年にデータ駆動で中国ローカル企業を指導し、射出成形可能な再生PET樹脂を開発している。
データを公開しても良いから、と言われて、それが動機となって開発したからデータ駆動、としゃれているわけではない。マテリアルズインフォマティクスが日本で注目されていない50年ほど前から研究してきた当方は、グラフ用紙1枚でデータ駆動による実験を行い、3カ月で新たなポリマーアロイを開発している。
最近、このデータ駆動の方法をAIと組み合わせて、大量のデータをAIに判断させ、材料開発をしようという流行があるが、あくまでも内挿による推定となることに気がついて欲しい。
分かり易く言うと、難燃性樹脂を開発するにあたり、空気中で自己消火性にもなっていない樹脂のデータを集めて、自己消火性の樹脂をAIに考えさせる、といった外挿的な開発は難しいのである。
偶然できることもあるかもしれない。ベイズ統計の世界では、起こりうる可能性があるのだが、高分子の難燃化には、ある一定の条件がそろわない限り、期待される難燃性樹脂を開発できないのだ。
すなわち、そのある一定条件の一つが欠けた状態のデータを大量に集めて最良の難燃性樹脂を開発することなどできないのである。
このような問題を克服する方法も、実はあるが、それはまだ公開されていない。すなわちこの方法そのものが特許になるのでご興味のあるかたは問い合わせて頂きたい。4月13日の技術情報協会のセミナーではヒントを少し話す。
カテゴリー : 一般
pagetop
ロシアのウクライナ侵攻がそろそろ終結するのか、と思っていたら、ノーベル平和賞を希望していたトランプ大統領が、次々と戦争を始めた。イランまでは順調に見えたが、イランとの戦争状態は、世界経済を巻き込んだ。
当初短期決戦のようなトランプ大統領の発信が相次いだが、どうも長期化しそうである。数年前台湾有事が世界の関心事だったが、米ロの戦争状態がしばらく続く、コロナ禍前に想像できない世界となった。
トランプ大統領は、各国に「石油は自分で取りに行け」と発信し、戦争終結の見通しなどたたない状態である。石油製品の値上がりは必至だが、このような時代の流れになると、高分子リサイクル技術実用化が一気に進みそうである。
すなわち、バージン材よりも高価だった環境対応樹脂が普及する可能性が高い。日本でセラミックスフィーバーが起きた時、クリントン大統領はナノテクとバイオケミストリーの国家プロジェクトにサインしている。
ポリ乳酸事業が立ち上がったが、バージン材とのコスト差がまだあり、普及速度は遅かった。しかし、石油製品の急激な値上げが今後続くと、環境対応樹脂が一気に進む可能性がでてくる。
カテゴリー : 一般
pagetop
カレンダーを見たら4月1日なので、昨日の話を信じない人もいるかもしれないので、本日は異なる側面から書いてみる。
2005年8月にPPS押出成形による中間転写ベルトの半年後に迫った量産化をスムーズに立ち上げるために、統合した旧Mの部長と役割を交代した。
そして、旧Mで5年以上国内で高分子技術がトップレベルのコンパウンドメーカーと共同開発が行われてきたすべてのデータを見直した。
この時、Excelファイルの整理にはC#を用いているが、大変だった。大量の過去データを整理して、大別すると2群のデータに分かれることが見えてきた。
1群のデータは最も多く、歩留まりが10%前後のデータである。その中で、規格値を変更して50%近くまで歩留まりが上がったり、さらには70%というデータもあったが、これらを同じ物差しで規格化するとやはり10%程度の歩留まりしかないことが明らかになった。
もう1群は、30%以上の歩留まりであり、高い時には50%まで向上している群である。面白いことに、このような高い歩留まりが得られていても、その方向の検討が十分になされていなかったのだ。
この他に、面白い傾向が5年以上の蓄積されたデータから見えてきて、コンパウンドをカオス混合すれば、歩留まりが少なくとも50%以上になる確信が得られた。
そこで、コンパウンドメーカーにこれを提案したのだが断られただけでなく、自分で勝手にコンパウンド工場を建てて、とまで言われた話を以前ここに書いている。
話がそれたが、3カ月後にはコンパウンドメーカーの部長のお言葉に甘えて、カオス混合のプラントを立ち上げ、歩留まり100%の押出成形に成功するのだが、この成功は、5年以上の大量のExcelファイルを整理して得られたものである。
一定期間のExcelファイルは、ある実験条件における実験結果のデータ群である。しかし、5年以上のデータ群の中では、どのような位置づけになるかは不明で、この位置づけを見極めるだけでも新たな知が生まれる、ということが意外と知られていない。
カテゴリー : 一般
pagetop