活動報告

新着記事

カテゴリー

キーワード検索

2024.04/17 データサイエンスと私(7)

20社のタイヤ解剖データの中には、ゴム部分の面積を計測したデータ群があった。ビードやトレッド、ショルダーなどタイヤの構造に合わせて面積を計測するルールを決めて収集したデータである。


しかし、ビード部には金属の面積も含まれていた。ビード部だけでなく、トレッドのベルト部は、金属ベルトもあればポリエステルベルトもある。


さて、これらをどうするか、という議論になって、結局もう一回データを集めなおそう、と情報工学科出身者が言い出したので蜂の巣をつついたような騒ぎになった。


指導社員が、例えばビード部の金属にしてもその面積は恐らく同じタイヤサイズなら大きく変わらないだろうから、その面積データを加工し、平準化したらどうか、とアドバイスしてくださった。


ゴムについても比重が異なるので、本来なら面積ではなく重量で解析をした方が好ましい。この点についても指導社員は、面積データの変動に対して比重換算で重量を正確に求めた時の変動が大きく異なるなら意味があるが、ゴム種個々の比重差は金属とゴムの比重差より小さいので、云々と解説してくださった。


その他、指導社員のご指導を受けながら、面積データを加工して、解析するデータの一覧表を作成した。データマイニングでは、ただデータをコンピューターに放り込んで解析できるケースは幸運だろう。大抵はこのように解析しようとするデータについてまず考察を加える必要がある。

データサイエンスを用いてデータ解析するにあたり、情報工学出身者がオピニオンリーダーのように最初はなっていたが、作業が進むにつれて、彼の影は薄くなっていった。

優秀な社員であったが、実際にデータマイニングするのは初めてであり、結局皆がその手法を理解している必要を悟り勉強し始めたので、大学で学んだ知識の影が薄くなった。

今の情報工学科で何を教えているのか知らないが、データマイニングであれば、当方は情報工学の卒業生に負けない自信がある。50年近く勉強してきたのでこのようなことを書くのは大人げないが、40年前もそうだった。

各分野で必要とされる情報工学の知識について、おそらく今でも独学で対応できるのではないか。教科書となる情報が身の回りに溢れている。

政府はIT人材に力を入れ始めたが、弊社のセミナーを活用していただければ、日常のデータマイニングであれば、十分な知識がえられる。

日曜日であれば、当方も休みなので、無料サービスセミナーを開講しても良いと思っているので、問い合わせていただきたい。条件を満たせば無料サービスセミナーを休日に開講します。

ゴールデンウィークにリスキリングを志してはいかが?スキル向上を目指すサラリーマンを応援します。

カテゴリー : 一般

pagetop

2024.04/16 HVEVSDV

自動車業界でソフトウェア定義車両のことをSDVというらしい。HVからEVへ、そして今トレンドがSDVというニュースが多い。車に関心のある人ならばHVをハイブリッド車、EVを電気自動車と理解できるだろうが、それでもSDVからすぐにソフトウェア定義車両と思い浮かんだ人は業界人である。


AVは何か。自動運転車とまだ認知されていないが、オーディオとヴィジュアル機器の略であることはよく知られている。その手の趣味の人はアダルトビデオをすぐに思い浮かべるのかもしれない。


すると、SDVを見たときにSODの誤植と誤解する人もいるだろう。とにかくSDVはまだ広く認知されていない。CASEを初めて聞いた時にも意味が分からず勉強し、すぐにセミナー講師として招聘されている。


業界人よりも早くその可能性をまとめることができた故であるが、SDVに対しては何をいまさら、の感がある。自動車の発展史はSDVという見方ができるのだ。


また、そのような視点に立つと、自動車の不易流行が見えてくる。SDVで機械屋のトヨタは大丈夫か、という論調の記事があったが、大丈夫である。最近のトヨタ車の開発トレンドを見てそれに気がつかない人は業界人ではない。


プリウスのデザインに驚いていてはいけない。クラウンがいつの間にか、「いつかクラウンに」ではなく、「お好きなクラウンに」に変貌している。


このトヨタの車開発の変貌ぶりにその未来のトヨタを描けない人は勉強した方が良い。技術の日産は、日産自動車をうまく表現した言葉で、ゴーンが去ってからの車開発は、技術の日産の面目躍如の車が発表されている。


しかし、それは今車が向かう未来ではないのだ。技術の日産が危ない、と当方は感じている。日産自動車に妙薬は***である。***に関心のあるかたは問い合わせていただきたい。

カテゴリー : 未分類

pagetop

2024.04/15 データサイエンスと私(6)

データマイニングを行う時に科学のように仮説を設定する必要はない。一方金曜日に話題に出したアン・ヘッシュ演じる女性編集長のように恣意的にデータマイニングを行う方法もある。


どのような姿勢や方法でデータマイニングを行っても同じ結果になるならば、データサイエンスの手法は科学の手法と言いたくなるのだが、アンヘッシュが元カレから責められていたように、データの前処理により、データマイニングの結果は左右される。


新入社員研修でタイヤの軽量化を目的として、20社の同一サイズのタイヤを解剖し構造データを収集した。当初目的では構造データを整理するまでだったが、情報工学科出身の新入社員が多変量解析をやろうと言い出した。


このあたりの話は、以前この欄に紹介しているので、詳細を省略するが、データ解析にIBM3033に用意されていた統計パッケージを使用している。


この時、多種類の構造データをすべて入力し、どの種類のデータを選択するのか検討している、というのはあとづけの説明である。


最初に収拾した構造データをすべて入力したところ、20種類のタイヤデータに対して変数が20種類を超えていたために、期待した結果が得られなかった。


すぐにメンバーの一人が情報工学科出身者を叱責している。そして、データ入力方法から皆で検討しなおした、というのが正直な姿である。


すなわち手元にあるデータを何でもコンピューターに放り込めばデータマイニングできるわけではないのだ。やはり、期待している結果に対応する最適なデータ入力方法の検討が必要である。


アン・ヘッシュの元カレが非難していたように、都合の良いデータ群を選んだり、次元を調整するためにデータを加工しなければ、データマイニングでよい結果が得られない。

カテゴリー : 一般

pagetop

2024.04/14 ダシの量

味の素一振りの料理人が評判だそうだ。味の素はグルタミン酸ソーダの粉末だが、学生時代の有機合成の試験にこの合成法を問う問題が出た。過去問で出題頻度が高かったので記憶していたが、今は発酵法で合成されているらしい。


味の素は本当に一振りで料理の味を変えるのか実験したところ、4人前の分量の味噌汁では、確かに一振りで味が変わった。


それでは、ということでカツオだしや昆布ダシなど、手当たり次第にダシの量について実験したところ、一つの結論が出た。本だしはじめ各種商品には100cc当たりのダシの量が書かれているが、書かれている量の半分で十分の量であることを確認した。


例えばみそ汁を作る時に、商品に書かれた量の半分で十分なダシの効果があるということだ。さらに、複数のダシ商品を用いるときに注意しなければいけないのは、それに塩が含まれている場合がある。


この実験をしていて慌てたのは血圧があがったことである。恐らく塩分摂取量が多くなったためと思われるが、合わせだしでは、商品に記された量の1/3以下とするとよい。


すなわち、味の素に限らず、市販されているダシを使う時、袋に記載された量の1/2以下でダシの効果を味わうことができ、複数のダシを用いるとさらに使用量を減らすことができる。


ゆえに味の素一振りのからくりは、合わせだしとなるので、一振りで十分な量が料理に添加されるからである。


味の素はグルタミン酸の塩だが、カツオダシはイノシン酸である。シイタケにはグアニル酸が含まれている、と言われているが、干しシイタケにすると格段に増える。


もしシイタケ味噌汁が好きな人ならば、シイタケを1日天日干ししてから使うと良い。信じられないくらいのダシが出る。干しシイタケを使った場合には、味の素一振りで他のダシはいらない。


注意しなければいけないのは、シイタケを保存用としたい時には1週間程度干す必要がある。シイタケを冷蔵庫に買い置きするぐらいならば、窓辺にむき出しで並べておくとよい。


最近シイタケには菌床で育てられているものが多く売られていることを知ったが、昔ながらの材木で育てられたシイタケよりもグアニル酸が少ないように感じるので天日干しが必要である。


最後に老人は市販のダシの量に気をつけないと知らずに塩分取り過ぎとなるので注意が必要と書いておく。合わせだしとすることで使用量を減らすことができるので味の素一振り技は伊達じゃない。

カテゴリー : 一般

pagetop

2024.04/13 紅麹と製造現場

昨日の関西テレビ速報で、床にこぼれた紅麹原料を使ったり、培養タンクに温水が混入しても生産していた実態が明らかになった、と報じられた。(https://news.yahoo.co.jp/articles/84b0ea83bfb0d25c8558767237ce48728b63dfb1)


当方の立ち上げたPPSコンパウンドの生産では高価なPPSの粉が床にこぼれた場合、全量廃棄している。そして、こぼれた原因を確認できるまで、その工程は生産を再開しない、という手順としている。


トラブルが発生した時にすぐに全ラインを止めたいが、二軸混練機をそのまま停止するとさらに大きなトラブルとなるので、困難である。

しかし、ラインが動いている状態では、供給原料が不足する可能性があるので、前工程のトラブルの報告を受けた後、生産を止めるかどうか判断するような手順書を作成している。


ただし、停止時と再開時にロスが必ず発生するので前工程のトラブル発生時の対応策をそれぞれ決めている。


床にこぼれた原料は、救済措置が取れそうでも、こぼれた原料を全量廃棄とするのは、ややもったいないが、このような措置でエラーの回復が迅速となるだけでなく、不良原料の混入を防止できる。すなわち、品質重視の対応である。


高価なエンジニアリングプラスチックの生産でもこのような対応をとっているのに、食品でありながら床にこぼれた原料をそのまま使用する製造現場とは、いかなる品質管理基準なのか。

カテゴリー : 一般

pagetop

2024.04/12 データサイエンスと私(5)

「統計でウソをつく法」という数式を使わないで学ぶ統計学の入門書がブルーバックスから出版されている。ロングセラーの名作だが、タイトルが秀逸である。


統計処理された結果は、データの信頼性まで示されるので騙される人が多い。「6デイズ7ナイツ」では、ファッション誌のアンケート結果について恋人同士で喧嘩する光景が描かれている。


そこでは、統計データをまとめるときに、自分たちの都合の良いデータを集めて、雑誌の趣旨に合うように統計処理結果を操作している、と編集長である主人公をデートの最中に彼氏が責めるのである。


デートの最中に彼女の仕事を批判する無粋な男で、主人公のアン・ヘッシュにふられるのだが、データの扱い方で統計処理の結果が変化する問題を彼は語っており、その発言内容は間違っていない。


データサイエンスを科学の分野に応用しようとする時に、データマイニングでは知を求めている人が、必要な知を適切な手法で取り出せるようにデータ処理からアルゴリズム最適化まで自ら行うのが好ましい。


そのために適切なアルゴリズムを自ら組み立てる能力が必要があり、いやがおうでもプログラミングスキルを研究者は磨かなければならない。


すなわち、データマイニングとは、データとアルゴリズムを駆使して新たな知を導き出す作業であり、プログラミングスキルとデータの前処理スキルが研究者に求められている。


このことを幸運にもゴム会社の新入社員研修で情報工学学科出身者から学んだ。また、柔軟な思考風土のタイヤ部門で研修できたことも運が良かった。


当時いきなり研究所に配属されていたならば、データサイエンスを研究に応用しようなどと考える機会など無く、科学馬鹿になっていたかもしれない。


科学は自然現象を理解する一つの方法であるが、アン・ヘッシュ演じる編集者が男と女の関係を理解しようとデータサイエンスを用いたように、形式知に近い結果が得られるようデータマイニングする方法も現象を理解する一つの方法である。


これを科学的ではない、という無粋な科学者は、自然現象から見捨てられるかもしれない。アン・ヘッシュ演じるロビンが彼氏を捨ててハリソン・フォード演じるクインに走ったように、自然現象は孤島で知恵を絞って常識にとらわれず問題解決にあたる技術者に新しい機能を与えてくれる。

カテゴリー : 一般

pagetop

2024.04/11 データサイエンスと私(4)

プログラミングスキルは、データサイエンスを学ぶ上で重要である。情報工学科を卒業してきて、プログラミングは嫌いです、と平然と言う人がいる。どのように勉強してきたのか、あるいはどのような指導を受けてきたのか、このような言葉を聞くと疑問に思う。


プログラミング以外の研究もあるので、というのがそのような情報工学専門家の意見だが、データサイエンスを異分野で活用する時に、プログラミングスキルが不要という人はデータサイエンスをよく理解していない人だ。


今の時代ならば、最低でもPythonぐらいは自由自在に使えなくてはいけない。ChatGPTがあるので敷居は大変低い。弊社のセミナーを1日聞けば誰でもプログラミングスキルが身につく。


なぜデータサイエンスでプログラミングスキルが必須なのか。それはデータ処理にプログラムが必要だからである。プログラムはプログラマーに作らせればよい、と言っていては駄目である。


プログラムでデータ処理するときに試行錯誤しながらデータ処理を行う場合があるからである。すなわち、データ処理方法の妥当性を得られた結果だけでなくデータ処理方法を考える過程も考慮する必要があるからだ。


これはどのような意味なのか。数理モデルで問題を解くときに、モデルの立案方法は科学ならば真理が一つなので一つに定まるが、データサイエンスを現象に応用しようとする時に科学的プロセスとならないからである。

カテゴリー : 一般

pagetop

2024.04/10 データサイエンスと私(3)

データから情報を取りだす技術が情報工学であるが、今はデータから「知」を取り出すことが求められる時代となった。すなわちデータマイニングをどのように行うのか、が情報工学の研究対象である。


しかし、まだ完璧に成功しているわけではない。「コンピューターの処理によりデータから取り出された情報」を知になるのかどうか、人間が確かめねばいけない段階である。


これは、当方が40年以上前から取り組んできた状況とさほど変わっていない。当方がデータサイエンスで解をだすと、周囲のスタッフが「科学的に求められたものではない」とイジメてきたのである。


これをいじめでは無く指導と受け取り、データサイエンスで得られた解を科学的に改めて証明し、解を求めてきた。


転職の原因となった電気粘性流体の問題では優秀なスタッフ6人が長期間かけて出した否定証明の科学的に完璧な解をデータサイエンスにより一晩で解を出すことができたのは、このような努力を10年以上してきたからである。



ちなみに本当のAIと呼べるものは、かつて話題になった「マトリックス」という映画で描かれた世界に登場した「AI」である。また、マテリアルズ・インフォマティクスでも十分な知となっていないから、それをネタに研究論文を書ける時代なのだ。


当方は先月開催された日本化学会年会で、40年以上前に当方が当時の情報工学の先端レベルの方法で行った手法と今マテリアルズ・インフォマティクスで話題になっている手法との比較を科学の解を添えて発表した。


この発表の目的は、相関が期待される現象では、40年以上前の手法でも十分に現在でも通用する、ということを示したかったからである。


また、30年以上前にはタグチメソッド(TM)が生まれアメリカで普及し始めた。その後、この手法が日本に輸入されて現在に至るが、TMでは、実験計画を立案し最低限のデータ収集で知が得られることをご存知ない方が今でもいる。


TMは、単なる品質工学という意味だけでなく、技術者が基本機能を正しく定義した時に新たな知を手順に従うだけで得られる巧みな手法である。手法そのものがアルゴリズムとなっており、マテリアルズ・インフォマティクスと呼べる。

カテゴリー : 一般

pagetop

2024.04/09 昨日のクロ現、紅麹

昨日NHKクローズアップ現代で、小林製薬紅麹問題を取り上げていたが、品質管理問題に深く言及していないだけでなく、元グンゼ技術者の匿名条件の談話に疑問が残った。


公知のように今回の紅麹は1987年にグンゼが研究開発し、50数件の特許で固められた科学の成果である。すでに基本特許が切れていたので匿名者は製造方法を機密性の高いノウハウと表現し、発酵過程で異物は入らないので、粉砕工程以降で異物が入ったのかもしれない(注)、と説明していた。


また、特許によれば嫌気性条件で培養しているので好気性の青カビが繁殖するのを防ぐことができる。この匿名技術者は自信をもって培養過程における他のカビの繁殖を否定したのだろう。


ところが、この点について出演した専門家の見解は、発酵過程で青カビが入ったのだろうと解説し、NHKも番組の構成でこの見解の違いをクリアーに表現していた。


一方、発酵過程のサンプルが抜き取り保管されていることが説明されたが、その他の工程の抜き取りサンプルが存在しないとした。これは品質管理上問題があるサンプリング手法である。


また、グンゼの匿名技術者の発言と比べると違和感が出てくる。匿名技術者が発酵過程で異物が入らない工程と自信を持って発言しているのに、何故他の工程でサンプリングを行っていないのかである。


特許によれば培養タンクは空気以外のガスで満たされていることになっている。ゆえに青カビなどが入る余地はない、と言っている点は理解できる。しかし、このタンクに投入する紅麹原料の品質管理について放送では語られなかった。


数人の専門家がこの事件について語っていたが、やや残念だったのはグンゼの特許について言及していなかった点である。当方が特許を調べたきっかけは、他の紅麹製造者が30日で発酵を終えるところを小林製薬は50日かけているところに疑問を持ったからである。


ニュースに報じられた専門家の意見として発酵時間が長いので異物が入るリスクが高い、という意見が早くから出されていた。恐らく匿名技術者もこの専門家の意見の存在を知っていて、発酵段階では絶対にありえないとしたのだろう。


特許を読むと、もし窒素ガスを循環させていたとしたならば他の製造法に比べれば異物の入るリスクは激減する。それゆえ粉砕工程以降と科学的な推論を匿名技術者は展開されたのだろうと想像している。


この問題は、報じられている内容から品質管理技術が稚拙だったために起きたと予想されるが、驚くのは、今回のような問題のある品質管理を行っているところが多いようだ。また、それに気がついていない企業もあるようだ。いろいろヒアリングを行って日本の品質管理技術の問題に気がついた。


品質管理技術や品質工学は弊社の得意領域であり、特にタグチメソッドはPythonを使い分かり易くご指導しております。お問い合わせください。


また、本紅麹製造技術についてご相談されたい方もお問い合わせください。今回の問題でかなり勉強をさせていただきました。


(注)小林製薬は、工場の移転を行っており、移転の理由がこの匿名者の見解にあったとすると、これまでの小林製薬の対応は不誠実である。推定が入るので詳細は述べないが、すでに死者が出ているので工場移転理由のすべてを公開すべきである。

カテゴリー : 一般

pagetop

2024.04/08 データサイエンスと私(2)

大学4年時に在籍した有機合成の講座は、優秀な研究者ばかりでレベルが高かった。卒業後DICの役員になられた方や、相模中央研所長になられた方、東工大教授になられた方などが同じ研究室にいた。


有機合成デザインをコンピューターで行うコーリーが推進していた研究の話題が、時々雑談で行われていた。最初はそのような話題について行けなかったが、その後当時について名づけられた「第一次AIブーム」となるような状況を説明した本を読み有機合成デザインだけでなく、様々な材料設計にコンピューター導入の研究がなされていることを知った。


大学院ではSiCウィスカーの講座で無機材料を有機合成の手法で合成する研究を行っている。いわゆる無機高分子の研究だが、この講座では、4年の時のような先端の話題が無かった。必死で先輩の話題についてゆく努力が不要だったので気楽だった。


ゴム会社に入社し、1か月半のグループ研修で情報工学出身者から情報工学についてご指導していただいた。この同期のおかげでデータサイエンスを業務に取り入れる動機ができた。


また、新入社員研修で多変量解析をIBM3033の統計システムで行った経験談は、以前この欄で書いているので省略するが、当時情報工学科ができたばかりであり、その学問の姿がよくわからない時に、この同期から聞いた話はその後の勉強の手引きとなった。


すなわち、情報としての「データ」の重要性であり、「データ」から有用な情報を取りだす技術が情報工学である、というアルゴリズムが中心だった時代に大変勉強になった手引きを同期から学んだ。

カテゴリー : 一般 連載

pagetop