活動報告

新着記事

カテゴリー

キーワード検索

2023.10/11 データサイエンスを実務で活用する(3)

新入社員の研修発表で多変量解析を用いた年に、タイヤ材料開発設計部においてタイヤ材料へ用いる乳化重合SBRを多変量解析で分子設計し、特許出願されている。


いわゆるマテリアルズインフォマティクスが、40年以上前に企業で大型コンピューターを用いて行われていた。あまり知られていないが、物質の創造にコンピューターを用いてロジカルに行う手法は50年前の第一次AIブームの時代に生まれている。


なぜかこの10年弱の間におけるマテリアルズインフォマティクスの講演会で、この話に触れられた研究者の講演を聞いたことが無い。


最近流行したマテリアルズインフォマティクスは第3次AIブームの中で起きており、第一次とは異なる、という認識であれば、昨日紹介したCTOの「オオバカモン」という言葉を発したくなる。


第3次AIブームは、今年の話題の中心であるCHAT GPTに使われたような、人工知能が中心であり、マテリアルズインフォマティクスも第一次AIブームとは全く異なる、と言っているようでは、その本質を正しく理解していない。


確かに、過去の二回のAIブームは一過性のブームで終わり10年も続かなかったが、今回のAIブームは10年以上続いているだけでなく、ますます盛り上がっている。


1980年代にセラミックスフィーバーがあり、それがナノテクノロジーへと昇華した時のような状況に似ている。これは、アルビントフラー著「第3の波」がベストセラーとなった時から始まったDXとの融合が進んでいるからである。


DXは、我々の生活習慣まで変革しているだけでなく、思考や価値観等諸々の変革をも引き起こしている。欧米では1980年代からトランスサイエンスが叫ばれ、科学と非科学の見直しが進んだ。


イムレラカトシュの死後「方法の擁護」が彼の著として発表されたのは、それを示していると当方は感じている。


ならば、研究開発もその例外ではなく、日々活用しているエクセルはじめデジタルツールの見直しから科学の手法に至るまでパラダイムの再考が求められていると思う。


弊社のセミナーはこのような視点で行っている。10月31日にはシーエムシーリサーチで下記セミナーが予定されている。依頼があれば各企業で出前セミナーも可能です。

カテゴリー : 一般

pagetop

2023.10/10 データサイエンスを実務で活用する(2)

ゴム会社では日科技連の指導でQCを定着させ、「最高の品質で社会に貢献」という社是に恥ずかしくない会社となった。しかし、当方が入社した時には、統計手法の普及定着を全社で活動している時代だった。


研究所では人事部門の努力にもかかわらず、統計手法の導入に反対していただけでなく排除しようとさえしていた。タイヤ開発部門は実務で統計手法を導入していたが、情報工学の黎明期ということもありデータサイエンスまで勉強していた技術者は少数の優秀な方たちだけだった。


面白いエピソードとして、新入社員の技術実習の話題がある。当方含む5人はタイヤ構造設計部隊で世界20社のタイヤを解剖してリバースエンジニアリングするテーマを与えられた。


1か月かけてタイヤを解剖し、得られたデータを表にまとめた。そして、一部のデータについて単相関のグラフを指導社員の指示で作成した。グループメンバーの一人が情報工学科の卒業生であり、このようなデータは多変量解析で整理すると面白い、と言い出した。


メンバーの顔が輝いて、「では君が整理してくれ」の大合唱。「まてまて、それにはコンピュータが必要だ」となった。指導社員はすぐにIBM3033の統計パッケージのマニュアルを持ってきてくれた。


この段階で、情報工学科の卒業生は、「ごめん、ちょっと言ってみただけ」となり、「ばかやろう」の大合唱と大笑いとなった。指導社員も「英文のマニュアルしかないので使えない」と笑っていたが、当方は「今から多変量解析の日本語教科書を皆で学習理解し、これを使ってみよう」と提案した。


突然ドン引きされ、少し気まずい雰囲気になったので「僕が今から本を買ってくるから、それでやろう」と提案し、すぐに新宿紀伊国屋書店へ走った。


しかし、紀伊国屋書店の専門書コーナーにも、教科書として適切な本は奥野先生の「多変量解析」ぐらいしかなく、それを購入した。そして新品の本をばらし、皆で分担してIBM3033英文マニュアルの翻訳を行っている。


苦労の末、技術実習を構造設計部門の部長に褒めていただけるレベルまで、まとめ上げることができた。しかし、技術実習発表会の日、当方ら5人は自信を持って発表したところCTOから大きな声で「おおばかもん」と叱責され、長々と説教を受けることになった。

カテゴリー : 一般

pagetop

2023.10/09 データサイエンスを実務で活用する(1)

「まず何から学ぶか」で統計手法の重要性をくどくどと体験を交えて書いてきた。その理由は、統計手法を実務で活用する、あるいは科学の手法で仕事をしてきた習慣にデータサイエンスの習慣も加える、ということに抵抗のある人が多いからである。


当方は1979年にゴム会社に入社したが、半年間の研修期間中と1年間50万円会社が支払ってくれて受講した日科技連の研修で、統計手法を身に着けることができた。


しかし、すぐに実務で活用できたとは言い難い。それだけでなく、強い意志を持たなければ身に着けた手法を使わずにサラリーマン生活を終えたかもしれない、と思っている。


その結果、データサイエンスの活用により問題解決のスピードが上がることや研究開発における大小の企画においてフロントローディングが容易になることなど様々なメリットを享受できなかった可能性がある。


当方は大学の教養部時代に統計学を6単位取得しているが、それでも統計学を研究に導入する自発的意欲はわかなかった。ゴム会社で「全社で統計手法を活用しているから、統計手法を身につけよ」と研修で指導されなければ、必死で実務に導入する意欲はわかなかった。


また、当時はデータサイエンスの黎明期で多変量解析が大型コンピュータの高価な統計パッケージ(車数台分の価格)として用意されていた時代である。それを1時間でも使えば、およそ1万円かかった。


ゴム会社に用意されていても使用している人は少数だった。タイヤ部門ではデータ整理こそ分散分析が行われ統計手法で吟味されていたが、データサイエンスまで普及していなかった。


研究所では統計手法を実務で使うどころか、馬鹿にしていた。さらに積極的に使おうとしている人たちをいじめていたのである。当方も実験計画法により最適条件を外すとサービス残業で仕事をやれ、と上司からも言われたりした。研究所は、各種ハラスメント以外に会社方針も無視して活動する、そのような時代だった。

カテゴリー : 一般

pagetop

2023.10/08 まず何から学ぶか(7)

6回に分けて、統計を学ぶことが最初に必要と書いてきたが、それを理解できたなら、分散分析の手法を習得し、実験計画法を理解していただきたい。


実験計画法を正しく理解できたかどうかは、このあとに、タグチメソッドを学ぶとチェックできる。このタグチメソッドを学ぶところまでを効率よく進めたい。実験計画法を学ぶところまでは、導入部分であり、頭を科学の視点以外にも働かせることができるようにするためだ。


そのためには弊社のセミナーを活用するとよい。統計からタグチメソッドまで1日で理解できるようにご指導いたします。トランスサイエンスの問題もお話いたします。


タグチメソッドを理解できたら、1日でPythonのプログラムを組めるようになりたい。そのためには、タグチメソッドのプログラムを作成しながら学ぶPython入門あるいはPythonで学ぶタグチメソッドが便利だ。


この他に、統計解析プログラムを作成しながらPython入門とか、多変量解析プログラムを作成しながら学ぶPython入門とか、ご希望によりPython入門セミナーを企画します。


弊社のPython入門セミナーの特徴は、単なる入門ではなく、実務の課題にすぐ取り組めるような入門セミナーを目指しています。是非ご利用ください。

カテゴリー : 一般

pagetop

2023.10/07 データサイエンスのスキル(5)

50年近く前のゴム会社の研究所では、誰も実験計画法を使おうとしなかった。実験計画法では因子の効果を考察しにくい、というのがその理由だった。


これは故田口先生も指摘されているが、だから主効果を割り付けるL18実験を推奨すると説明されている。そしてタグチメソッドにより得られた結果が確認実験で再現されるならば、自明となった制御因子により一因子実験を行ってもタグチメソッドと同様の結果が得られると説明されていた。


それでは、なぜタグチメソッドを行うのかと言えば、ロバストを高める制御因子を明らかにするためである。一因子実験だけではロバストがどれだけ向上しているのか評価できないから、と説明されていた。


タグチメソッドでは、1.ロバストを高め、2.調整因子で最適化を行う2段階開発を行うのが基本で、科学の単なる一因子実験とは大きく異なるのである。


さて、当方は転職してタグチメソッド推進委員として活動する前に、ゴム会社で実験計画法の改良版を独自に考案し、使っていた。すなわち、研究所で笑われてばかりでは面白くないので、実験計画法で最適条件を外さない方法を検討していた。


そして、実測値をそのまま直交表に割り当てるのではなく、相関係数を割り当てて実験計画法を行うと最適条件を外さずに当てることが可能であることを発見した。


そして、SiCヒーターやSiC切削工具の開発を短期間で成功しているが、この時の体験談を故田口先生にお話しし、お褒め頂いた。ただし、その時当方の方法は感度をあげる開発であり、好ましくないところとノイズを組み合わせていない問題がある、とアドバイスも頂いた。


それでは、何を褒めていただいたのかというと、実測値をそのまま直交表に割り付けて行う実験計画法でなぜ最適条件を外すのかという点についての考察である。

カテゴリー : 一般

pagetop

2023.10/06 まず何から学ぶか(6)

電気粘性流体の事例は30年以上前の事例となるので、最近の事例を紹介する。理研で起きたSTAP細胞の騒動も実験者が統計学あるいはタグチメソッドを学んでいたなら防げたはずである。


理研所長は小保方氏を未熟な科学者と記者会見で述べ、小保方氏はコピペを理由に学位を剥奪された。この事件についてニュース記事から事実を拾い出して考察すると統計学とタグチメソッドの重要性を理解できる。


騒動が起きたときに、理研のある理事が、「誰か、一つでもよいからSTAP細胞を作れ」と命じた記事がニュースとなっている。

科学の方法にこだわるとこのような指示になるが、実験を正しく統計学に基づき行おうとするか、あるいはタグチメソッドで実行しようと考えたならば、まともな実験結果が得られる指導をできたはずである。そして自殺者も出さずにすんだ可能性がある。


また、余談となるが、ゴム会社の研究所で当方が電気粘性流体の耐久性問題をデータサイエンスで解決したときに、当方含め3人も同時期に転職するような事態となった。これがSTAP細胞同様の科学に関わる事件としてご理解いただけると思う。


全てを書きにくい事件であり、さらに暗い話となるのでこれ以上書かないが、科学者と統計学との接点では、このような事件が起きている。

データサイエンスを研究する場合には科学の方法となるが、これが現象の理解に用いられる時に、厳密には科学の方法とはならないことに注意しなければいけない。

そして実験結果が組織にとって有益であったとしても、科学的ではないという理由だけで常軌を逸した判断や行動をとる研究者やリーダーがいる。


詳細を省略するが、哲学者イムレラカトシュは、厳密な科学の方法は否定証明となる、科学と非科学の境界は時代により変わると述べている。


科学の方法について、それを唯一の方法として押し付けてくる人物が近くにいたら注意した方が良い。科学の方法についてイムレラカトシュが指摘しているように柔軟に対応したい。


科学とは何か、いろいろな見解があるかもしれない。例えば物理学者マッハは、マッハ力学史でニュートンの方法を非科学的と評価している。この時代には論理学が完成し、科学が生まれた時代と言われている。


科学という哲学を正しく理解できると、非科学の方法にも問題解決するための有効な方法がある、という見解を持つことができる。この時統計や広くデータサイエンスの手法を問題解決に活用しようと学びたくなるはずだ。

統計手法やタグチメソッド嫌いを実務の現場で見てきたが、科学の方法にこだわりを持っていた人ばかりだった。

カテゴリー : 一般

pagetop

2023.10/05 まず何から学ぶか(5)

電気粘性流体の耐久性問題を界面活性剤で解くことができない、という否定証明は、科学的に完璧な報告書だった。しかし、データの扱いは、統計科学の視点から問題があった。


日本を代表する高偏差値大学の工学博士が2名もいて、誰もその問題に気がついていないどころか、統計によるデータ処理を必要としない,とまで言い切っている。


恐らく、科学信奉者の多くは、仮説に適合したデータさえ得られればよくて、そのデータにばらつきがあっても、あるいは仮説に適合しないデータがあっても、帰納法で仮説をうまく説明できてしまうと気にならないのだろう。


これは、科学の落とし穴である(注)。もし、統計科学の視点で実験データを眺めていたら、当方が出願した特許の内容に気がついたはずである。特許の明細書案ができたときに、そんなことは当たり前として考えていたから発明者に名前を載せろと言ってきた。


特許を検索していただけばこの事実を確認できるが、微妙な問題もあるのでここには特許番号を書かない。とにかくその後様々な事件が起き、電気粘性流体の仕事に関わった当方の同僚3人が退職しているのだ。


大きな事件になってしまったが、人事部が積極的に推進していた統計手法の普及努力を軽視し、独りよがりの科学信奉を強制しようとしたメンバーだけでなく本部長も含め、その原因について深く考えようとせず隠蔽化へ動いた。


アメリカでは、トランスサイエンスが話題になり始めていたが、日本では偏った科学重視の研究開発が企業で行われていた。統計科学にも一応科学がついているので重視すべきであるが、ゴム会社ではQC手法と呼んでいたので現場の手法と勘違いしていた研究所スタッフが多かった。


データサイエンスにも「サイエンス」がついている。まず、「何から学ぶべきか」は、「統計の正しい意味」を知り、「実験のやり方には少なくとも二つの方法がある」ことに気がつくことである。


技術開発における実験について、機能を確認するために行われることを知らない研究者は多い。義務教育時代から学んだ、仮説を確認するための実験を企画しやすいからである。


タグチメソッドの学習シーンでは、しばしば基本機能とは何か、という問題で無限ループに陥る研究者を見てきたが、実験で検討すべき機能を見出せない人には機能のばらつきの意味を考えることもできない。


(注)「統計でウソをつく方法」とか「統計の落とし穴」とかいう記事が多かった時代でもある。今のようなデータ重視の考え方を否定する意見がもてはやされていた。例えば、映画「6デイズ7ナイツ」にも、主人公の女性のボーイフレンドが「統計数値を意図的に解釈している」と雑誌記者である主人公を責めるシーンがある。ビッグデータの活用がブームとなっている今の時代からは想像できないかもしれない。40年前には統計に批判的な書籍も出版されている。統計と科学の方法との関係について考える時に、このような時代があったことを知ると、科学の方法における統計の位置づけが時代により変化することを理解できる。統計がどのような学問なのか、それを学ぶと、科学の一分野であるが科学そのものではないことに気づく。故田口先生がタグチメソッドは統計ではない、と言っておられたが、タグチメソッドが統計学から生まれている点に注目する必要がある。自然の真理を明らかにするために実験を行うが、その実験と技術における機能との関係を明確にしたのがタグチメソッドである。統計学は、実験のやり方について、偏りのない方法を推奨しているだけであり、実験と機能の位置づけを明確にしていない。

カテゴリー : 一般

pagetop

2023.10/04 まず何から学ぶか(4)

サンプリングについて正しく理解でき、そこから平均値や誤差、さらには誤差の分散の意味まで正しく身につけると科学の実験方法の落とし穴に気がつくはずだ。


実は科学の方法にこだわっている人も正しく統計学を身につけると、否定証明に走ることが無くなるだけでなく、新たな発見を可能とする心眼を育てることができる。


ゴム会社の研究所で科学を命とした前任者から交代した当時の本部長は、研究所の改革に着手したが、別の本部長に交代したとたんに、元の研究所に戻ってしまった。そしてそこから生まれた電気粘性流体の耐久性問題に関する否定証明は、科学的に完璧な報告書だった。

この研究の結果生まれたのが、「加硫剤から老化防止剤まですべての添加剤が入っていない、世界初のゴム開発」というテーマであるが、ゴム会社の研究所で最重要テーマとして扱われた。


ゴムをご存知の方ならば大笑いするような出来事だが、これを笑ってはいけないことは、サラリーマンなら理解できるはずだ。当方は笑いをこらえて、テーマを担当するにあたり1週間の猶予を申し出ている。


そしてその1週間でデータサイエンスの手法で問題解決したのである。この技術成果は特許として成立しているが、明細書案を作成しても出願にあたり当方一人だけの発明者にしていただけなかった。


さて、電気粘性流体の耐久性問題では、どこに落とし穴があったのか。それは、界面活性剤で問題解決できない、という否定証明の結論から想像がつくと思われるので詳細を書かないが、分子構造既知でHLB値も正しく求められる界面活性剤だけ検討していたのである。


すなわち、研究を行うにあたり、問題解決の可能性を「科学的に正しい」と言える範囲に絞って検討していたのだ。未だ界面科学について未解決の領域が残っているのにそのようなフィルターをかけてしまっては、自ら解決策を排除しているようなものである。

カテゴリー : 一般

pagetop

2023.10/03 車の話題

この数カ月自動車に関する話題が多くなった。モーターショーの影響もあるかもしれないが、中国のEV墓場のニュースが今年初めから何度も報じられているのは少し気にかかる。


日本の自動車メーカーのEV化が遅れており、その関係もあるのか、と勘ぐってしまう。しかし、自動車の電動化は猛スピードで進行しており、マツダのロータリーエンジンもハイブリッド車における発電機として進化したニュースには驚いた。


日産が限定版のスカイラインNISMOを発売し、ガソリン車として最後のFR車として注目を集めている。マツダもガソリンのロータリーエンジン車を限定発売しても売れたのではないか。


スカイラインは1000台限定である。ロータリーエンジン車も1000台限定車で採算が取れたように思う。ガソリンエンジン車にあこがれている自動車愛好家は一定数いるだろう。


水平対向エンジンやロータリー以外ならば6気筒以上無ければモーターのようなしっとりした乗り味は得られない。アクセルに対する応答は、低価格車ではモーターの乗り味の方が良いことを多くの人は知ってしまった。


自動車の動力は今後すべて電動化されるにしても、水素燃料電池の将来動向が気にかかる。欧米ではインフラ整備を辞めたところもあるという。


トヨタとホンダは燃料電池車にも力を入れているが、他の自動車メーカーは消極的である。しかし、充電時間を考慮すると、燃料電池車のガソリン車以上に速いエネルギーチャージ速度は魅力的である。


中国で急速に電動化が進行し、EV墓場が現れたことをEV化の未来のように書いている記事は、中国という国をよくご存じない。あのEV墓場は、乱立しすぎたEVメーカーの倒産で現れたのである。


当方はEV墓場以外に、大なり小なりいろいろと産業の墓場を中国で見てきた。EV墓場のニュースで、電動化に竿さす内容で報じているニュースは不十分な取材記事である。


今中国のエンプラで伸びているのはPPSである。先日この欄に書いたが、コロナ禍前に当方は蘇州ナノポリスにある某ローカルメーカーを指導した話である。


すべてのEVメーカーで使われるPPSの納入に成功した、と挨拶状が届いた。PPSは日本メーカーの寡占状態の材料だったが、中国企業の生産量もEVの生産量拡大に呼応してのびてきた。

カテゴリー : 一般

pagetop

2023.10/02 まず何から学ぶか(3)

科学では仮説を設定して、それに基づく実験をすべて実験者のコントロール下で行う。例えば仮説を実証するために誤差の問題が問われるような時には、必要とされる繰り返し実験を行い、平均値や標準偏差を求めたりしている。


そして、Nで割るのかN-1で割るのか悩んだ末、自分の都合の良い方で標準偏差を求めている科学者もいるだろう。ゴム会社の研究所では、このようなシーンが絶えなかったが、笑うことができなかった。


笑いをこらえる苦しさに気づき、裸の王様という童話における深い意味を学んだ。また、科学の実験において、サンプリングの意味さえ無視されているケースもゴム会社で見てきた。


これは、当時同僚の嘆き節だが、上司の提唱しているゴム網目理論に合致したデータ以外受け付けない上司で困った、という。すなわち、実験データをグラフ化した時に、理論式から外れたデータについて、理論式に合うまで実験をさせられたという。


データを捏造したくても、理論式に適合したサンプル提供を求められるので大変だという。プロセス条件をいじりながら、それらしいデータが出るまで実験しなくてはいけないそうだ。その上司はサンプリングの意味やプロセシングの位置づけを誤解されている方だと思った。


サンプリングが統計学上意味のある形で実施されたときに、そのサンプリング条件において平均値とその誤差が意味を持ってくる。すなわち、サンプリングについて学んだら、平均値と誤差、偏差等の統計パラメーターの意味を正しく学ぶことは大切だ。


すると自然に正規分布だの二項分布だのが分かってくるので学習時間の節約ができる。統計学の教科書では、正規分布の理解を最初に求められるが、難解な数学的理解よりもサンプリングから生じる誤差がどのようなモノか理解できれば、自然と誤差の分布からこれらを理解できるようになる。


数学的に厳密な理解よりもこの感覚的な理解は重要である。感覚的に理解できてから数式をみると不思議なほどすっきりと頭に入ってくる。


大学で6単位統計学の単位を取得しても、統計に基づく実験を大学でさせていただけなかった。研究とは新しいことを見つけることで、科学の方法で見出された新しいニュースを常に求められた。


ゴム会社に入社し、工場実習で品質管理を担当し、工程管理手法を学んだ時にはじめて大学で6単位取得した内容を理解できたと感じた。工程管理手法は中卒の担当者にご指導いただいた。大学の先生より説明がわかりやすかった。


統計学に基づき収集されたデータでサポートされたモデルが技術開発には重要である。そのモデルが科学的に説明できるかどうかよりも、統計的に再現確率の高い技術が重要である。


科学でサポートされていないカオス混合プラントは、現在も収率100%で稼働しているという。科学的な品質管理が行われている、トランスサイエンスの世界である。


カオス混合技術はタグチメソッドにより開発されたのでロバストが高い。トランスサイエンスを理解できれば科学的に開発できなくてもタグチメソッドで新技術を開発できるのである。このあたりについて、後日書きたいが、とにかくサンプリングを正しく理解し、そのデータを正しく処理できるように各統計パラメータの正しい意味を記憶することが大切である。

カテゴリー : 一般

pagetop