活動報告

新着記事

カテゴリー

キーワード検索

2023.05/11 実務におけるデータサイエンスの役割

実務における問題解決法のセミナーの類としてロジカルシンキングは今でもニーズがあるロングセラーのテーマである。一方今時当たり前の回答しか出せないTRIZやUSITは人気が無い。このようにセミナーのテーマには時代により流行り廃りがある。


データサイエンスについてはこれから人気が出るセミナーのテーマではないかと予想しているが、データサイエンスという表題はある意味抽象的でわかりにくいのではないかと心配している。


また、最近はビッグデータが話題になり、その処理を機械学習で行う方法に注目が集まっている。AI人気もその類である。


しかし、実務の現場で5個以上100個未満のデータに対して機械学習で処理を行うというのは、期待値に対して得られる結果の寄与率は低い。


このような小規模のデータ群に対しては多変量解析による処理が最適である。但し、重回帰分析や主成分分析にも限界があり、非線形データに対する対応にはひと工夫が必要になる。


ただ、機械学習と異なる点は、弊社でも重回帰分析と主成分分析の処理プログラムを公開しているように、すぐに解析ができる無料で動作するプログラムが解放されていることだ。


ちなみにこのホームページのプログラムでは、エクセルデータを張り付けるだけで解析できる。機械学習でもデータ処理の目的は、分類か回帰、あるいは予測であり、その目的であれば、まず何も考えずデータを処理できる点で多変量解析は機械学習よりも簡便だ。


また、実務でデータサイエンスを使うとよいシーンを整理してみても、とりあえず手元のデータから何がわかるのか、を知りたいときが多い。ただその時に機械学習のプログラムを作成し解析を進めたい、というケースは少ないのではないか。


少なくとも当方が32年間サラリーマンとして勤務していた時に多変量解析とタグチメソッドがあれば十分だった。機械学習に取り組んだのは退職直前の時間ができた時である。


(注)多変量解析を機械学習に含めている記述が成されている論文や教科書が存在するが、それは一つの考え方に過ぎない。多変量解析には機械学習のような専用のプログラムを組む必要は無く、汎用の多変量解析でデータ処理し、人間の頭でデータマイニングを行うのが基本である。多変量解析は1960年代から知られており、1970年代にはいると心理学分野で大型コンピューターによる解析がおこなわれるようになった。また新QC7つ道具として紹介されたのも1970年代であり、ディープラーニングよりも古くから親しまれている方法だ。

カテゴリー : 一般

pagetop