活動報告

新着記事

カテゴリー

キーワード検索

2023.10/07 データサイエンスのスキル(5)

50年近く前のゴム会社の研究所では、誰も実験計画法を使おうとしなかった。実験計画法では因子の効果を考察しにくい、というのがその理由だった。


これは故田口先生も指摘されているが、だから主効果を割り付けるL18実験を推奨すると説明されている。そしてタグチメソッドにより得られた結果が確認実験で再現されるならば、自明となった制御因子により一因子実験を行ってもタグチメソッドと同様の結果が得られると説明されていた。


それでは、なぜタグチメソッドを行うのかと言えば、ロバストを高める制御因子を明らかにするためである。一因子実験だけではロバストがどれだけ向上しているのか評価できないから、と説明されていた。


タグチメソッドでは、1.ロバストを高め、2.調整因子で最適化を行う2段階開発を行うのが基本で、科学の単なる一因子実験とは大きく異なるのである。


さて、当方は転職してタグチメソッド推進委員として活動する前に、ゴム会社で実験計画法の改良版を独自に考案し、使っていた。すなわち、研究所で笑われてばかりでは面白くないので、実験計画法で最適条件を外さない方法を検討していた。


そして、実測値をそのまま直交表に割り当てるのではなく、相関係数を割り当てて実験計画法を行うと最適条件を外さずに当てることが可能であることを発見した。


そして、SiCヒーターやSiC切削工具の開発を短期間で成功しているが、この時の体験談を故田口先生にお話しし、お褒め頂いた。ただし、その時当方の方法は感度をあげる開発であり、好ましくないところとノイズを組み合わせていない問題がある、とアドバイスも頂いた。


それでは、何を褒めていただいたのかというと、実測値をそのまま直交表に割り付けて行う実験計画法でなぜ最適条件を外すのかという点についての考察である。

カテゴリー : 一般

pagetop

2023.10/06 まず何から学ぶか(6)

電気粘性流体の事例は30年以上前の事例となるので、最近の事例を紹介する。理研で起きたSTAP細胞の騒動も実験者が統計学あるいはタグチメソッドを学んでいたなら防げたはずである。


理研所長は小保方氏を未熟な科学者と記者会見で述べ、小保方氏はコピペを理由に学位を剥奪された。この事件についてニュース記事から事実を拾い出して考察すると統計学とタグチメソッドの重要性を理解できる。


騒動が起きたときに、理研のある理事が、「誰か、一つでもよいからSTAP細胞を作れ」と命じた記事がニュースとなっている。

科学の方法にこだわるとこのような指示になるが、実験を正しく統計学に基づき行おうとするか、あるいはタグチメソッドで実行しようと考えたならば、まともな実験結果が得られる指導をできたはずである。そして自殺者も出さずにすんだ可能性がある。


また、余談となるが、ゴム会社の研究所で当方が電気粘性流体の耐久性問題をデータサイエンスで解決したときに、当方含め3人も同時期に転職するような事態となった。これがSTAP細胞同様の科学に関わる事件としてご理解いただけると思う。


全てを書きにくい事件であり、さらに暗い話となるのでこれ以上書かないが、科学者と統計学との接点では、このような事件が起きている。

データサイエンスを研究する場合には科学の方法となるが、これが現象の理解に用いられる時に、厳密には科学の方法とはならないことに注意しなければいけない。

そして実験結果が組織にとって有益であったとしても、科学的ではないという理由だけで常軌を逸した判断や行動をとる研究者やリーダーがいる。


詳細を省略するが、哲学者イムレラカトシュは、厳密な科学の方法は否定証明となる、科学と非科学の境界は時代により変わると述べている。


科学の方法について、それを唯一の方法として押し付けてくる人物が近くにいたら注意した方が良い。科学の方法についてイムレラカトシュが指摘しているように柔軟に対応したい。


科学とは何か、いろいろな見解があるかもしれない。例えば物理学者マッハは、マッハ力学史でニュートンの方法を非科学的と評価している。この時代には論理学が完成し、科学が生まれた時代と言われている。


科学という哲学を正しく理解できると、非科学の方法にも問題解決するための有効な方法がある、という見解を持つことができる。この時統計や広くデータサイエンスの手法を問題解決に活用しようと学びたくなるはずだ。

統計手法やタグチメソッド嫌いを実務の現場で見てきたが、科学の方法にこだわりを持っていた人ばかりだった。

カテゴリー : 一般

pagetop

2023.10/05 まず何から学ぶか(5)

電気粘性流体の耐久性問題を界面活性剤で解くことができない、という否定証明は、科学的に完璧な報告書だった。しかし、データの扱いは、統計科学の視点から問題があった。


日本を代表する高偏差値大学の工学博士が2名もいて、誰もその問題に気がついていないどころか、統計によるデータ処理を必要としない,とまで言い切っている。


恐らく、科学信奉者の多くは、仮説に適合したデータさえ得られればよくて、そのデータにばらつきがあっても、あるいは仮説に適合しないデータがあっても、帰納法で仮説をうまく説明できてしまうと気にならないのだろう。


これは、科学の落とし穴である(注)。もし、統計科学の視点で実験データを眺めていたら、当方が出願した特許の内容に気がついたはずである。特許の明細書案ができたときに、そんなことは当たり前として考えていたから発明者に名前を載せろと言ってきた。


特許を検索していただけばこの事実を確認できるが、微妙な問題もあるのでここには特許番号を書かない。とにかくその後様々な事件が起き、電気粘性流体の仕事に関わった当方の同僚3人が退職しているのだ。


大きな事件になってしまったが、人事部が積極的に推進していた統計手法の普及努力を軽視し、独りよがりの科学信奉を強制しようとしたメンバーだけでなく本部長も含め、その原因について深く考えようとせず隠蔽化へ動いた。


アメリカでは、トランスサイエンスが話題になり始めていたが、日本では偏った科学重視の研究開発が企業で行われていた。統計科学にも一応科学がついているので重視すべきであるが、ゴム会社ではQC手法と呼んでいたので現場の手法と勘違いしていた研究所スタッフが多かった。


データサイエンスにも「サイエンス」がついている。まず、「何から学ぶべきか」は、「統計の正しい意味」を知り、「実験のやり方には少なくとも二つの方法がある」ことに気がつくことである。


技術開発における実験について、機能を確認するために行われることを知らない研究者は多い。義務教育時代から学んだ、仮説を確認するための実験を企画しやすいからである。


タグチメソッドの学習シーンでは、しばしば基本機能とは何か、という問題で無限ループに陥る研究者を見てきたが、実験で検討すべき機能を見出せない人には機能のばらつきの意味を考えることもできない。


(注)「統計でウソをつく方法」とか「統計の落とし穴」とかいう記事が多かった時代でもある。今のようなデータ重視の考え方を否定する意見がもてはやされていた。例えば、映画「6デイズ7ナイツ」にも、主人公の女性のボーイフレンドが「統計数値を意図的に解釈している」と雑誌記者である主人公を責めるシーンがある。ビッグデータの活用がブームとなっている今の時代からは想像できないかもしれない。40年前には統計に批判的な書籍も出版されている。統計と科学の方法との関係について考える時に、このような時代があったことを知ると、科学の方法における統計の位置づけが時代により変化することを理解できる。統計がどのような学問なのか、それを学ぶと、科学の一分野であるが科学そのものではないことに気づく。故田口先生がタグチメソッドは統計ではない、と言っておられたが、タグチメソッドが統計学から生まれている点に注目する必要がある。自然の真理を明らかにするために実験を行うが、その実験と技術における機能との関係を明確にしたのがタグチメソッドである。統計学は、実験のやり方について、偏りのない方法を推奨しているだけであり、実験と機能の位置づけを明確にしていない。

カテゴリー : 一般

pagetop

2023.10/04 まず何から学ぶか(4)

サンプリングについて正しく理解でき、そこから平均値や誤差、さらには誤差の分散の意味まで正しく身につけると科学の実験方法の落とし穴に気がつくはずだ。


実は科学の方法にこだわっている人も正しく統計学を身につけると、否定証明に走ることが無くなるだけでなく、新たな発見を可能とする心眼を育てることができる。


ゴム会社の研究所で科学を命とした前任者から交代した当時の本部長は、研究所の改革に着手したが、別の本部長に交代したとたんに、元の研究所に戻ってしまった。そしてそこから生まれた電気粘性流体の耐久性問題に関する否定証明は、科学的に完璧な報告書だった。

この研究の結果生まれたのが、「加硫剤から老化防止剤まですべての添加剤が入っていない、世界初のゴム開発」というテーマであるが、ゴム会社の研究所で最重要テーマとして扱われた。


ゴムをご存知の方ならば大笑いするような出来事だが、これを笑ってはいけないことは、サラリーマンなら理解できるはずだ。当方は笑いをこらえて、テーマを担当するにあたり1週間の猶予を申し出ている。


そしてその1週間でデータサイエンスの手法で問題解決したのである。この技術成果は特許として成立しているが、明細書案を作成しても出願にあたり当方一人だけの発明者にしていただけなかった。


さて、電気粘性流体の耐久性問題では、どこに落とし穴があったのか。それは、界面活性剤で問題解決できない、という否定証明の結論から想像がつくと思われるので詳細を書かないが、分子構造既知でHLB値も正しく求められる界面活性剤だけ検討していたのである。


すなわち、研究を行うにあたり、問題解決の可能性を「科学的に正しい」と言える範囲に絞って検討していたのだ。未だ界面科学について未解決の領域が残っているのにそのようなフィルターをかけてしまっては、自ら解決策を排除しているようなものである。

カテゴリー : 一般

pagetop

2023.10/03 車の話題

この数カ月自動車に関する話題が多くなった。モーターショーの影響もあるかもしれないが、中国のEV墓場のニュースが今年初めから何度も報じられているのは少し気にかかる。


日本の自動車メーカーのEV化が遅れており、その関係もあるのか、と勘ぐってしまう。しかし、自動車の電動化は猛スピードで進行しており、マツダのロータリーエンジンもハイブリッド車における発電機として進化したニュースには驚いた。


日産が限定版のスカイラインNISMOを発売し、ガソリン車として最後のFR車として注目を集めている。マツダもガソリンのロータリーエンジン車を限定発売しても売れたのではないか。


スカイラインは1000台限定である。ロータリーエンジン車も1000台限定車で採算が取れたように思う。ガソリンエンジン車にあこがれている自動車愛好家は一定数いるだろう。


水平対向エンジンやロータリー以外ならば6気筒以上無ければモーターのようなしっとりした乗り味は得られない。アクセルに対する応答は、低価格車ではモーターの乗り味の方が良いことを多くの人は知ってしまった。


自動車の動力は今後すべて電動化されるにしても、水素燃料電池の将来動向が気にかかる。欧米ではインフラ整備を辞めたところもあるという。


トヨタとホンダは燃料電池車にも力を入れているが、他の自動車メーカーは消極的である。しかし、充電時間を考慮すると、燃料電池車のガソリン車以上に速いエネルギーチャージ速度は魅力的である。


中国で急速に電動化が進行し、EV墓場が現れたことをEV化の未来のように書いている記事は、中国という国をよくご存じない。あのEV墓場は、乱立しすぎたEVメーカーの倒産で現れたのである。


当方はEV墓場以外に、大なり小なりいろいろと産業の墓場を中国で見てきた。EV墓場のニュースで、電動化に竿さす内容で報じているニュースは不十分な取材記事である。


今中国のエンプラで伸びているのはPPSである。先日この欄に書いたが、コロナ禍前に当方は蘇州ナノポリスにある某ローカルメーカーを指導した話である。


すべてのEVメーカーで使われるPPSの納入に成功した、と挨拶状が届いた。PPSは日本メーカーの寡占状態の材料だったが、中国企業の生産量もEVの生産量拡大に呼応してのびてきた。

カテゴリー : 一般

pagetop

2023.10/02 まず何から学ぶか(3)

科学では仮説を設定して、それに基づく実験をすべて実験者のコントロール下で行う。例えば仮説を実証するために誤差の問題が問われるような時には、必要とされる繰り返し実験を行い、平均値や標準偏差を求めたりしている。


そして、Nで割るのかN-1で割るのか悩んだ末、自分の都合の良い方で標準偏差を求めている科学者もいるだろう。ゴム会社の研究所では、このようなシーンが絶えなかったが、笑うことができなかった。


笑いをこらえる苦しさに気づき、裸の王様という童話における深い意味を学んだ。また、科学の実験において、サンプリングの意味さえ無視されているケースもゴム会社で見てきた。


これは、当時同僚の嘆き節だが、上司の提唱しているゴム網目理論に合致したデータ以外受け付けない上司で困った、という。すなわち、実験データをグラフ化した時に、理論式から外れたデータについて、理論式に合うまで実験をさせられたという。


データを捏造したくても、理論式に適合したサンプル提供を求められるので大変だという。プロセス条件をいじりながら、それらしいデータが出るまで実験しなくてはいけないそうだ。その上司はサンプリングの意味やプロセシングの位置づけを誤解されている方だと思った。


サンプリングが統計学上意味のある形で実施されたときに、そのサンプリング条件において平均値とその誤差が意味を持ってくる。すなわち、サンプリングについて学んだら、平均値と誤差、偏差等の統計パラメーターの意味を正しく学ぶことは大切だ。


すると自然に正規分布だの二項分布だのが分かってくるので学習時間の節約ができる。統計学の教科書では、正規分布の理解を最初に求められるが、難解な数学的理解よりもサンプリングから生じる誤差がどのようなモノか理解できれば、自然と誤差の分布からこれらを理解できるようになる。


数学的に厳密な理解よりもこの感覚的な理解は重要である。感覚的に理解できてから数式をみると不思議なほどすっきりと頭に入ってくる。


大学で6単位統計学の単位を取得しても、統計に基づく実験を大学でさせていただけなかった。研究とは新しいことを見つけることで、科学の方法で見出された新しいニュースを常に求められた。


ゴム会社に入社し、工場実習で品質管理を担当し、工程管理手法を学んだ時にはじめて大学で6単位取得した内容を理解できたと感じた。工程管理手法は中卒の担当者にご指導いただいた。大学の先生より説明がわかりやすかった。


統計学に基づき収集されたデータでサポートされたモデルが技術開発には重要である。そのモデルが科学的に説明できるかどうかよりも、統計的に再現確率の高い技術が重要である。


科学でサポートされていないカオス混合プラントは、現在も収率100%で稼働しているという。科学的な品質管理が行われている、トランスサイエンスの世界である。


カオス混合技術はタグチメソッドにより開発されたのでロバストが高い。トランスサイエンスを理解できれば科学的に開発できなくてもタグチメソッドで新技術を開発できるのである。このあたりについて、後日書きたいが、とにかくサンプリングを正しく理解し、そのデータを正しく処理できるように各統計パラメータの正しい意味を記憶することが大切である。

カテゴリー : 一般

pagetop

2023.10/01 大サービスのお知らせ

2023年10月5日(木)にCMCリサーチ主催の下記セミナーへ弊社経由でお申し込みされますと昨日告知いたしました土日特別セミナーを無償で受講できるサービスを提供いたします。下記セミナー参加希望のご連絡と同時に、サービスで提供いたします土日特別セミナーの参加予定候補日3つご指定ください。詳細は、弊社へお問い合わせください。

カテゴリー : 一般 学会講習会情報 宣伝

pagetop

2023.09/30 特別セミナーのお知らせ

昨日お問い合わせがございまして、急遽土日限定のセミナーを企画することにいたしました。統計手法を中心としたデータサイエンスの入門セミナーです。


ディープラーニングも含めたデータサイエンス全体セミナーにつきましては、これまでセミナー会社の要望を受けまして講師を努めてきました。


その経験から、統計知識の基礎を含めた入門セミナーの必要性を感じ、「まず、何から学ぶか」という連載を書き始めました。


1日ですべて習得する前提ではなく、セミナーを受講していただいて、セミナーテキストを参考に受講後自学自習をできるような構成を考えています。


内容は、多変量解析まで含み、Pythonの自学自習も可能なような濃厚なセミナー内容を提供したい、と考えています。また、テキストには文章を多くしてセミナー終了後に見直せる様な構成とします。


セミナーで解説するプログラムはすべてPythonで記述し、テキスト購入者にはプログラムコードを配布するとともにPythonの詳しいインストール方法をまとめたpdfを配布いたします。


受講料はテキスト無し5000円、プログラム付テキスト(電子ブック)含む受講料は1万円を予定しています。10月8日以降の土曜日と日曜日に開講予定ですのでお申し込みください。


お申し込みはこちら

カテゴリー : 一般

pagetop

2023.09/29 まず何から学ぶか(2)

統計手法を正しく理解することは、データサイエンスにおいて大切なことである。しかし、この全体を習得するには3年かかるだろうと思われる。専門に勉強しても1年半はかかる。これは大学のカリキュラムを見てみれば理解できる。


当方の学生時代に統計学について2単位は必須であったが、残り4単位は選択となっていた。当方はカリキュラムのすべてを習得しただけでなく、文学部で行われていた心理学における統計学の応用の学問も教養部時代に学んでいる。


幸運なことに大学院では授業料が免除されたが、学部では授業料を支払っていたので、取得できる単位をすべて取得しようと努力した結果である。その結果、単位をとりすぎて教務課から注意を受けている。


このような学生時代に学んだ経験から、統計学について何が重要であるのか公開したい。すなわち、それを学び理解できたならデータサイエンス全体の学習に入ることが可能となる。


最近のデータサイエンスに対する説明を読むと統計学は、データサイエンスの一部として扱われている。しかしこのようなとらえ方そのものが誤解を生むことになっている。


まず、統計学とは何か、という教科書に数ページ書かれていることをしっかりと理解することだ。そうするとサンプリングの重要性に気がつく。


もし、タグチメソッドを実務で使われてきた方ならば、この気づきでノイズの水準がなぜ必要なのか理解できるはずだ。調合誤差まで設計して実験をしなければいけない理由に気づけばサンプリングについて理解できたと思ってよい。

カテゴリー : 一般

pagetop

2023.09/28 まず何から学ぶか(1)

当方がデータサイエンスのスキルを身につけた体験談を書いてきたが、30年ほど前までデータサイエンスに対する技術者の関心は低かった。また、高学歴で科学の方法を十分に学んだ人ほどデータサイエンスを毛嫌いしていた傾向が強い。


ゴム会社では、新入社員に1人50万円ほどかけて日本科学技術連盟のベーシックコースを1年間学ぶ機会を提供していたが、それでも研究所では統計手法は普及しなかった。それゆえタイヤ開発部門と研究所とはQCに対して意識の違いが大きくなった。


これは、非タイヤ部門の化工品事業で品質問題が多かったことと無関係ではないだろう(注)。研究所では非タイヤ部門のテーマが研究されており、タイヤ部門の基礎研究については、タイヤ基礎研究部という組織が存在していた。


すなわち、基礎研究部門がゴム会社には二つあり、タイヤの研究テーマを扱っていなかった研究所では、徹底して科学の方法が重視されていた。新入社員として配属された時に大学よりもアカデミックな雰囲気でびっくりしたぐらいである。


ゆえにアカデミアよりも研究レベルが高い分野も存在していた。とりわけ分析技術については世界一ではなかっただろうか。高分子の難燃化研究グループには、世界中の難燃性評価装置が揃っていた。


科学一色の中でデータサイエンスの研究を開始した経験から、まず何を学ぶべきか、と聞かれたならば、統計手法の基礎を勉強することが大切とお伝えしたい。


ただし、統計手法も全部を学ぼうとすると社会人ならば1年以上かかると思う。ちなみに日科技連のベーシックコースは1年で統計学の基礎を学べるようになっていた。


基礎のコースでも毎月の課題消化に大変だった。上司経由でテスト結果が届いただけでなく、修了証をもらえなかった場合には、研修でかかった費用を給与から天引きされるルールとなっていた。


ゆえにデータサイエンスを使いこなすために必要な統計学について、すべてを学ぼうとするとデータサイエンスを実務で活かせるようになるには3年かかるのではないか。


実際に当方は3年かかっている。3年かかって統計手法および多変量解析を自由自在に使えるようになって、科学で解けない問題を短時間でデータサイエンスで解けるようになった。


そしてそれだけのスキルを身につけたら殺されそうになったのである。会社方針を真面目に実践するのに、研究所では命がけだった。


その体験から言いたいのは、統計学でも学ぶべきことを選択し身につけてゆかないとデータサイエンスを使えるようになるまでに時間がかかってしまう、というアドバイスである。


また、データサイエンスについては、マテリアルズインフォマティクスのような側面と、科学で解けない問題を何とかして解きたいというニーズに応える側面とがある。


順次、これらについて経験談を書いてゆこうと思うが、すべてを書かないことを了解していただきたい。すべてをここに書いたら、弊社としてセミナーを開催している価値が無くなる。


弊社ではデータサイエンスを実務に適用しようと奮闘努力した経験から、そのスキルを短時間に身につけるカリキュラムを用意している。


(注)タイヤ部門のスタッフと化工品部門のスタッフでは、明らかに品質に対する考え方が異なっていた。研究所では品質を口にするだけで軽蔑される風潮があった。しかし企業の研究所がアカデミアよりアカデミックであることなど自慢できない。企業では、研究部門においても品質重視こそが重要で、そのうえでアカデミックであることを自慢すべきだろう。もし研究所の経営に困っている企業があれば、ご相談いただきたい。かつてU本部長が書かれた3冊の著書の続編にあたる技術経営について指南いたします。

カテゴリー : 一般

pagetop