活動報告

新着記事

カテゴリー

キーワード検索

2013.10/25 多変量解析とは(3)

ビッグデータのブームで多変量解析に注目が集まっているが、科学と技術の視点で面白いと思っている。多変量解析は40年以上前に統計科学で確立された学問で、最初は大型コンピュータ上で実用化された。

 

アンケートの集計や解析に活用されただけでなく、心理学の分野などでも利用された。技術として身近に活用されたのは洋服の型紙への応用である。そこでは主成分分析が使用された。ゴム会社では、分子設計に統計学手法が早くから使用されていたが、これは日科技連の影響が大きい。

 

多変量解析には重回帰分析や主成分分析、正準相関分析、変形主成分分析、判別分析、因子分析、クラスター分析など様々な方法があるが、利用価値が高いのは主成分分析と重回帰分析である。技術者であれば、この二つの科学的知識を身につけておいて損は無い。技術開発の現場でアイデアに困ったら、この2つの科学的知識をおまじないのごとく活用すると新たなアイデアが見えてくるという、そんなありがたい方法である。

 

ビッグデータ専用の解析手法と昨今は報じられているが、20個ほどのデータの解析で使用しても単相関で見えていなかった世界が見えてくる。例えばこんな使い方がある。

 

開発業務では前任者がうまくゆかなかった業務の尻ぬぐいを担当することがある。うまくゆかなければそのテーマは終わりで自分に責任が来る、という損な役割が回ってくるのはサラリーマン生活で1回や2回はあるはずだ。そのような経験が無い人は運が良い。運が悪いと20年そのような仕事ばかりで成果が出ても他人に持って行かれる、という生活になる。会社の仕組みが明らかに悪く、内部エネルギー消費型の決して業界トップになれない会社ではそのようなことが起きるかもしれない。

 

その様なときに、だまされたと思って多変量解析を使ってみると良い。うまく進捗していない仕事には何か原因があり、前任者の実験データは紙くずのように見えるかもしれない。しかし、そのくずデータを多変量解析するのである。開発がモグラたたきで推移した場合には、因子ばかり増加して訳の分からないデータ集となっているかもしれないが、多変量解析を行うと見えていない傾向が見えてくるときがある。前任者のデータは決してくずではないので活用する道を考えなくてはならない。

 

あるいは、多変量解析の結果、開発を進めてもダメ、という結果が早々と得られるかもしれない。これはこれで幸運である。全く新しい視点で開発を進めれば良いだけである。成功しても評価されず失敗したら責任が飛んでくる状態であれば、思い切ったアイデアを躊躇無く試すことができる。

 

但し多変量解析は統計的手法であることを忘れてはいけない。この手法で浮かび上がったアイデアを技術分野の常識で事前に検証することも重要である。30年間多変量解析を使用してきたが、単相関では見落としが多いという実感を持っている。前任者の仕事の解析結果なので、社内で公開しにくい側面もあり秘策として使ってきたが若い技術者にはタグチメソッド同様に有効な知識であるとお伝えしたい。

 

カテゴリー : 一般 連載

pagetop

2013.10/24 多変量解析とは(2)

朝出勤のために電車に乗る。電車の中ではスマホでSNSに書き込んだり、インターネットでニュースを閲覧したりする。会社近くの駅で降りコンビニにはいり、SUICAで買い物をする。会社についてコーヒーを飲みながらイントラネットで社内のニュースを見つつ外部のホームページをついでに閲覧して知識を少し蓄える。

 

朝の仕事を開始するまでの行動だけでも、次のようにいっぱいデータを世の中に提供している。

 

1.出勤時間

2.通勤区間

3.通勤区間における電車の速度

4.SNSに書き込んだ情報

5.どのようなニュースに関心があったか

6.朝の買い物で購入される品物

7.ホームページ閲覧時間

8.ホームページ閲覧ページ数

9.ホームページの経由地

10.興味を持ったホームページ

11.その他

 

通勤電車の混み具合を調査したければ、上記1,2,3の情報をインターネット上から集めればよく、JRではSUICAの情報を基に実施している。最近ではその情報を販売する、と報道されて問題になった。

 

今消費者がどのような事柄に関心があるかは、4-10までの情報を集めれば傾向がわかる。さらにそこへ閲覧時間が加われば、消費者の分類も可能である。ビッグデータが話題になっているが、膨大なデータに対してどのような目的で活用するのかが重要である。また逆に企業の活動方向を定めるのにどのようなデータを集めるのかという知恵が必要となる。

 

すなわちビッグデータの活用には、科学者が自然現象に対峙してきた姿勢を支えた科学の知識が要求される。その知識とは統計学であり、統計学の多変量解析に今注目が集まっている。

 

しかし多変量解析については、1971年に日科技連から奧野忠一らによる「多変量解析法」という著書が発表されている。これは40年以上前に科学的に確立された手法である。統計学ではないが、マハラビノスタグチメソッドという手法も普及してきた。

 

40年以上前は、マイコンも登場していなかったので、大型コンピューターに用意された高額なソフトウェアーパッケージで販売されていた。新入社員の頃IBM3033へパンチカードでデータを供給し、主成分分析を行ったことがあるが、入力から出力まで2時間かかった記憶がある。今なら入力にかかる30分程度の時間で出力が得られるのに、昔のコンピューターは、マルチタスクでCPUを占有することができず固有値の計算にも時間がかかっていた。

 

 

カテゴリー : 一般 連載

pagetop

2013.10/23 多変量解析とは(1)

調査や実験を行うときにデータを収集するが、データの収集は通常計画的に行われる。この時目的変数をyにしてx-y座標系にデータをプロットするために一因子だけのデータを集めるというのは稀で、多数の因子についてデータを収集する。例えば洋服の開発では、人間の体形データが必要である。この時身長以外に胸囲や腹囲、腕の長さ、座高など複数の項目すなわち因子についてデータが収集される。

 

集められたデータは、個人別にまず整理される。この時エクセルなどの表計算ソフトを使用し一覧表にまとめたり、予め用意しておいたデータベースにデータを入力してデータの組み替え加工をしやすいようにまとめたりする。

 

このように複数の項目について集められたデータ、すなわち多変数のデータのことを多変量データと呼び、それを解析して多変量データの中に隠れている各項目の関係その他を解析する手法が多変量解析である。最近ビッグデータ時代といわれているが、インターネットの世界からある目的のために仮説を立て因子を選びロボットを使い集められたデータも多変量データであり、これを多変量解析しているだけである。

 

ゆえに先日30年以上前のブームの再来と表現したが、30年前インターネットは無かったので再来と言っても中身は異なる。昔は多変量データを集めるにも大変な労力が必要になったが、今はインターネットの世界にロボットを放ち、容易に多変量データを集めることが可能である。

 

30年前は3年程度で下火になったが、恐らく10年以上続くブームになるかもしれない。あるいは、オタクのアニメ同様に様々なビッグデータを活用した各種トレンド解析が企業だけで無く個人の生活に入り込み一つの文化になるのかもしれない。そのようになったらタグチメソッド以上の文化大革命である。

 

タグチメソッドは技術系の開発メソッドとして定着し、企業によっては品質工学社内大会を行っているところも多い。しかし、実際のところ各企業でタグチメソッドを積極的に推進しているのは、残念なことにタグチオタクだけである。一般の生活にまで浸透するようなムーブメントになっていない。もし家庭の主婦がSN比を意識して料理を作るぐらいのブームになれば、オフクロの味も復活するのかもしれない。

 

因子をラテン方格に割り付け、実験の一部実施で因子の関係を導く実験計画法も多変量データを扱うので多変量解析の一つに入れても良いが、統計学では実験計画法は別のカテゴリーで扱い多変量解析には入れない。ゆえにタグチメソッドでL18以上の実験を組み外側に3水準ほどの誤差因子を割り付け多変量データを扱っていても、多変量解析とは言わない。

 

また実験計画法でデータを収集するときには、予めラテン方格に割り付けられた因子の水準で実験を計画的に行い、実験量を減らしても因子の寄与率等が計算できる仕組みが用意されているので実験手順に制約ができるが、多変量解析では、集める試料の個数と調査項目が決められておれば無作為にデータを収集すればよく、データ収集の時に実験計画法のように気をつかう必要は無い。だからロボットに機械的にデータを集めさせることが可能となる。誤差を調合するときに入れ忘れた誤差の影響を受けないのかびくびくする必要も無い。変動も重要なデータとして扱う。

 

但し、集められたデータに対しどのような手法で解析を進め、どのような結論を導き出すのか、すなわち仮説は予め立てておいた方が好ましい。データを集めてから多変量解析の手法を検討する手順で進めている場合も見られるが、解析された結果を考察するときに調査項目すなわち調査に取り上げた因子に不満が出て、せっかく収集したデータを棄却したりしてムダが出たりする。そもそもそのような解析では解析結果の信頼性が怪しくなる。ビッグデータの効率的な収集と解析に仮説は重要な役割がある。

 

 

 

カテゴリー : 一般 連載

pagetop

2013.10/22 ビッグデータ時代(2)

今のパソコンは、30年前の大型コンピューターを凌ぐ性能を誇り、メモリーも安くなった。すなわちソフトウェアーさえあれば家庭で気楽にビッグデータを扱える時代である。

 

しかし、多変量解析などの統計処理では、コンピューターでデータ処理を行うとその結果を手軽に得ることができるが、その結果が正しいのか、あるいはそもそも処理の仕方が正しいのか、統計処理の知識が無ければその判断すらできない。

 

統計学については、中学と高校で簡単に学習しその基礎が身についているはずであるが、大学入試で重視されてこなかったので社会人になって改めて統計学を学ぶことになる。技術開発を担当すれば、タグチメソッドとして出会うことになる。

 

「タグチメソッドは統計ではない」、というのは故田口先生の口癖で、タグチメソッドの真の狙いが技術開発思想にあり、実験計画法でSN比を計算したりするのはその目的ではない、というのがその理由であるが、SN比の計算方法は統計学の流れを組んでいる。そしてタグチメソッドにはマハラビノスタグチメソッドという多変量解析の手法もある。

 

タグチメソッドは統計ではないが、タグチメソッドに用いられている計算を正しく早く理解したいと思うならば統計学の基礎を勉強すべきである。このようなことを書くと故田口先生に叱られそうだが、統計学の基礎を理解しておれば、タグチメソッドが統計ではなく品質工学である、という理解も早くできる。

 

これが30年前ならば、日科技連のQC手法で技術系新入社員の必須科目として統計手法の基礎を学んだ。工程管理にも統計手法は重要で、これを理解していなければ現場の管理職として失格であった。この時代は科学と技術をあたかも味噌糞ごとき扱いをしていた頃である。

 

ところが今はコンピューターに数字を入れれば結果がすぐに出てくる時代であえて統計学の基礎を学ばなくても工場で仕事ができるようになった。タグチメソッドは統計ではない、とそのインストラクターも言うのでますます統計学を勉強しなくなった。

 

そこへ昨今のビッグデータブームである。改めて統計学が注目されているが、少なくとも技術屋は多変量解析まで一通り知っていた方が便利である。30年前は新QC7つ道具の一つとして多変量解析を学んだが、今はマハラビノスタグチメソッドとして学び、統計科学としての側面が見えなくなってきている。統計学は科学の一分野であり、技術の一つの手法であるタグチメソッドのカテゴリーではありません。

カテゴリー : 一般 連載

pagetop

2013.10/21 ビッグデータ時代(1)

統計学がブームだという。書店には様々な統計学の本が並んでいる。さらにアマゾンの成功を例にしてビジネスの成功は統計学のおかげと表現され、統計学が今後重要な学問となる、と新聞にも書かれている。

 

統計学のブームは過去にもあった。1980年前後のマイコンが登場した頃である。マイコンが登場した頃、それを何に利用するのか話題になった。用途が決まっていない道具が登場したのである。面白いのはシーズ指向からニーズ指向の研究開発が叫ばれていた時代である。

 

マイクロソフトのBASICが走るマイコンはパソコンと呼ばれるようになり、統計計算のパッケージが多数販売された。単なる平均値や単相関のソフトウェアーだけでなく、多変量解析のソフトウェアーも販売された。しかし当時の64Kバイトのメモリー空間では扱えるデータ量に制約があり、やがてブームは下火になった。

 

当時高分子の難燃化技術を担当していたときに、MZ80Kを購入し重回帰分析のプログラムを開発した。MZ80KではシャープオリジナルBASICと、今ではゲームソフトで有名なハドソンのHu-BASICを使うことができた。Hu-BASICにはF-DOS上で動作するバージョンもあり、何とBASICコンパイラーまで走っていた。

 

8ビットのZ80というCPUには8MHzバージョンがあり、MZ80KのCPUを換装すると世界最速のパソコンになった。ソフトウェアーからフロッピーディスクのシステムまで揃えると軽自動車1台分以上の値段になったが多変量解析をやりたくて購入した。

 

ホウ酸エステルとリン酸エステルを併用したガラスを生成する難燃化システムでホウ素原子が統計的に有為に機能しているかどうか証明するために多変量解析を行おうと考えた。まだ高分子の難燃化技術の分野で多変量解析が使われていなかったので論文を書くことができた時代である。

 

リン酸エステルの難燃剤を多種類購入し、ホウ酸エステルと組み合わせた軟質ポリウレタンフォームを40種類以上合成した。この40種類以上のサンプルの燃焼試験結果を解析しホウ素とリン、ハロゲン原子の3成分をパラメーターとした重回帰式を求めた。

 

カテゴリー : 一般 連載

pagetop

2013.09/11 科学と技術(50:ミドリムシプラスチックス2)

液晶用フィルムと言えばセルロースフィルムの独壇場であったが、最近ポリオレフィンフィルムがこの市場へ入ってきてセルロースフィルムメーカーは大変だと聞いた。ポリオレフィンフィルムはセルロースフィルムの製造工程で必要な有機溶媒を使用しない押出成形で製造されるのでLCAの観点から有利である。セルロースフィルムメーカーもメチクロ溶媒を使用しない押出成形を研究開発しているようで、特許がこの十年たくさん出ている。

 

粘弾性の性質を調べればすぐに理解できるがTACやDACは射出成形や押出成形が難しい材料である。しかし似たような構造だが同じ多糖類でもミドリムシプラスチックスの物性は大きく異なり簡単に射出成形が可能だ。MFRの値を見てもTACやDACが可塑剤を多量に用いた値よりも良いデータが得られている。

 

今年のセルロース学会ですでに報告されたが、世間の反応は今ひとつである。藻の培養技術は健康食品会社においてすでに商業生産の実績があり、(株)デンソーではバイオディーゼルの開発に取り組んでいる。ミドリムシは「肥だめ」でも育つのである。試しにPETボトルの側面を切り取って簡易育成容器を作り育ててみると良い。元気によく育ちすぐに増える。

 

ミドリムシの育成は小学生の夏休みの宿題には格好のテーマとなる。さらに中学の科学クラブであればこのミドリムシから多糖類を抽出することは簡単にできる。理科実験のテーマに未来技術のバイオリファイナリーを取り入れてはいかが。

 

ミドリムシと名前にムシがついているが、藻の仲間でありムシという名前は無視してよい。ユーグレナと言った方が耳あたりが良いかもしれない。栄養食品でユーグレナという呼び名を使うのは飲みやすくするためか。材料の名前に用いるとユーグレナプラスチックスとなるが、夕暮れのイメージよりもミドリムシプラスチックスのほうがバイオ感あふれている。

 

なぜ光をあててミドリムシを育てると1種類の多糖類が1個体あたり50%の収率でできるのかミドリムシの光合成における詳細な機構を知らないが、抽出して変性し利用する技術は、公知の方法で可能である。ミドリムシプラスチックスは科学の世界で考えても技術の世界で考えても面白い。

 

今週ミドリムシプラスチックスについて連載で書こうとしたが、都合により明日からはまたアイデアについて書く。但しここまで読まれてミドリムシプラスチックスに関心を持たれた方のお問い合わせにはお答えいたします。但し問い合わせは電子メールでお願いいたします。昨日電話がつながらなかった方にはお詫び申し上げます。

カテゴリー : 一般 連載 高分子

pagetop

2013.03/12 弊社の問題解決法<最終>

問題解決をこのように考えますと、答を実現するアクションについて答を決めた時に気がかりになるはずですから、答から逆向きに考えるのはものすごく自然な行為になるはずです。そして問題解決の一番最初にしなければならないことは、答すなわちあるべき姿を具体的に決めることであり、これが具体的に決まりますと難しかった問題について解決の糸口が逆向きの推論で明確になります。すなわち問題解決力とは、あるべき姿を具体化できる意思決定力のことだと思います。そして具体化されたあるべき姿に向けて行動を起こせば人生のあらゆる問題は解決されてゆくと思います。

 

カテゴリー : 連載

pagetop

2013.03/11 弊社の問題解決法について<53>

思考実験はニュートンにより始められた、と言われていますが、案外遠い昔から無意識に行われていた方法かもしれません。それをニュートンは無意識ではなく意識的に行い、それを発明のために良い方法だと気がついたマッハは、弟子のアインシュタインに教えたのでしょう。

 

祖先が無意識にやっていた経験に基づく問題解決を、科学の時代には科学的方法論でまとめ上げ、それを教育というシステムの中で伝承するようになり、本来人間に備わっていた勘や心眼による方法が軽視されるようになりました。

 

しかし、山中博士のノーベル賞を受賞した研究から、勘や心眼が持っている問題解決力のポテンシャルを改めて見直しても良いのではないでしょうか。幸いなことに勘や心眼は日常の生活の中で鍛えることができます。さらに、本書で紹介しました問題解決法は、勘や心眼を鍛える道具として使えます。

 

従来の問題解決法が役に立たない、と否定しているのではありません。そもそも問題を解くとは、答がある問題について答を実現するアクションを考えることなのです。問題そのものを科学的に分析して答を導き出すという行為は、科学者が答を見出すために行う一つのプロセスなのです。従来は問題を解く意味と答を見出すプロセスをごちゃまぜにしていただけです。答を見出すのに、科学的プロセスも使えますが、科学の無い時代のように勘や心眼、さらに経験までも使うことができるはずです。

 

<明日へ続く>

カテゴリー : 連載

pagetop

2013.03/10 弊社の問題解決法について<52>

カラスは、自動車を使い殻を割りクルミの実を食べるという方法を発見して動作として身に着けたのだろうと思います。他のカラスは、仲間がやっている方法を見て真似をすることでそれが広がっていったのではないでしょうか。

 

ここで重要なのは、クルミの硬い殻が自動車に轢かれて割れて中から食べられるおいしい実が出てくるのを最初に発見したカラスは、誰なのかということです。すなわち、彼こそがクルミの実という答を発見し、その答を導き出すアクション、すなわち車に轢かせて硬い殻を割るという方法を考案したカラスの世界のノーベリストです。

 

カラス如きに考案という熟語がふさわしく無いとするならば、この答とそれに直接結び付くアクションがワンセットであることを木の上から偶然見て、その同じ光景を仲間に見せることでその方法を伝承していったのです。すなわち彼は、硬いクルミの実を食べるにはどのようにしたら良いかという問題を偶然の発見により解くことができ、経験を積み重ねながら仲間たちに伝承していったのです。

 

科学の無い時代における技術の伝承も、おそらく人類はカラスと同じことをやっていたのではないかと想像できます。ただ、人類がカラスと大きく異なるのは想像力という万能シミュレーターを持っていたことです。

 

硬いクルミが像に踏まれることにより割れるのを見た人類は、像の代わりに自分で踏んでみることを試みたのかもしれません。そして自分の代わりに道具で硬いクルミの殻を割る方法を発明したのではないかと思います。

 

あるいは「像」に踏まれて硬いクルミの殻が割れるという発見から、「重いもの」に踏まれて硬いクルミの殻が割れるとか、「重い石」でクルミの殻が割れるとか、つぶやきながら頭の中でクルミの殻が割れるシミュレーションを行い、像によるアクションから石という道具の発見があったのかもしれません。

 

<明日へ続く>

カテゴリー : 連載

pagetop

2013.03/09 弊社の問題解決法について<51>

なお、本技術が開発された時には、ゾルでミセルを作ることができること、あるいはゾルの粒子に高分子が吸着するとミセルのように挙動することなどわかっていませんでした。脆いゼラチンをライバルの技術よりも優れた技術で割れにくくすることはできましたが、そのメカニズムの科学的な解明はできていません。

 

しかし、電子顕微鏡写真には、シリカゾルやラテックス粒子が全く凝集構造を作らないで分散している状態が映し出されていました。世界で初めての科学的成果は得られましたが、そのメカニズムの科学的解析ができましたのは、2000年に発表された論文のおかげです。

 

技術の世界には科学で解明されていなくとも、「あるべき姿」を具体化できれば実現できるKKDという不思議な力があります。第四章の問題解決法は科学的ではありませんが、ここで紹介しました事例のように発想力を引出し、眠っているKKDを呼び起こす作用があります。

カテゴリー : 連載

pagetop