2013.10/25 多変量解析とは(3)
ビッグデータのブームで多変量解析に注目が集まっているが、科学と技術の視点で面白いと思っている。多変量解析は40年以上前に統計科学で確立された学問で、最初は大型コンピュータ上で実用化された。
アンケートの集計や解析に活用されただけでなく、心理学の分野などでも利用された。技術として身近に活用されたのは洋服の型紙への応用である。そこでは主成分分析が使用された。ゴム会社では、分子設計に統計学手法が早くから使用されていたが、これは日科技連の影響が大きい。
多変量解析には重回帰分析や主成分分析、正準相関分析、変形主成分分析、判別分析、因子分析、クラスター分析など様々な方法があるが、利用価値が高いのは主成分分析と重回帰分析である。技術者であれば、この二つの科学的知識を身につけておいて損は無い。技術開発の現場でアイデアに困ったら、この2つの科学的知識をおまじないのごとく活用すると新たなアイデアが見えてくるという、そんなありがたい方法である。
ビッグデータ専用の解析手法と昨今は報じられているが、20個ほどのデータの解析で使用しても単相関で見えていなかった世界が見えてくる。例えばこんな使い方がある。
開発業務では前任者がうまくゆかなかった業務の尻ぬぐいを担当することがある。うまくゆかなければそのテーマは終わりで自分に責任が来る、という損な役割が回ってくるのはサラリーマン生活で1回や2回はあるはずだ。そのような経験が無い人は運が良い。運が悪いと20年そのような仕事ばかりで成果が出ても他人に持って行かれる、という生活になる。会社の仕組みが明らかに悪く、内部エネルギー消費型の決して業界トップになれない会社ではそのようなことが起きるかもしれない。
その様なときに、だまされたと思って多変量解析を使ってみると良い。うまく進捗していない仕事には何か原因があり、前任者の実験データは紙くずのように見えるかもしれない。しかし、そのくずデータを多変量解析するのである。開発がモグラたたきで推移した場合には、因子ばかり増加して訳の分からないデータ集となっているかもしれないが、多変量解析を行うと見えていない傾向が見えてくるときがある。前任者のデータは決してくずではないので活用する道を考えなくてはならない。
あるいは、多変量解析の結果、開発を進めてもダメ、という結果が早々と得られるかもしれない。これはこれで幸運である。全く新しい視点で開発を進めれば良いだけである。成功しても評価されず失敗したら責任が飛んでくる状態であれば、思い切ったアイデアを躊躇無く試すことができる。
但し多変量解析は統計的手法であることを忘れてはいけない。この手法で浮かび上がったアイデアを技術分野の常識で事前に検証することも重要である。30年間多変量解析を使用してきたが、単相関では見落としが多いという実感を持っている。前任者の仕事の解析結果なので、社内で公開しにくい側面もあり秘策として使ってきたが若い技術者にはタグチメソッド同様に有効な知識であるとお伝えしたい。
pagetop