2023.07/28 データサイエンス
1970年代に大型コンピューターで多変量解析を利用できるようになり、人文科学系研究のデータ活用レベルを飛躍的に高めた。
データサイエンスの黎明期であり、マイコンの登場もあって1970年末には情報工学科設置ブームが大学で起きている。
ところが、日科技連から公開された新QC7つ道具に多変量解析が紹介されながらも、技術開発ではデータによる演繹的推論よりも仮説を重視した実験データを積み上げる帰納的推論で研究開発が行われた。
すなわち、データは仮説を直接実証する目的で収集され、データサイエンスの手法は技術開発において一部の統計手法以外利用されなかった。
2010年初めに登場したマテリアルズインフォマティクスでは、AIを活用したデータマイニングが注目され、2017年には大学でデータサイエンスの講座設置ブームが起きている。
データサイエンスに半世紀以上の歴史があっても、その手法を用いた問題解決法がこれまでの仮説中心の科学的な手法とは異なるゆえに、これを技術開発に応用するときに戸惑う技術者は多かったのではないか。
また、一口にデータサイエンスと言っても多数の手法があり、例えば多変量解析だけでも2種類以上解析手法が存在する。
本セミナーでは、データサイエンスを用いる開発手法が、従来の科学的手法と異なる点に着目し、科学と技術の相違点ゆえに開発スピードの向上と独創性を生み出す手法として利用できる長所を解説する。
すなわち、問題解決手法には科学的問題解決法と非科学的問題解決法の二つのパラダイムが存在する。30年以上の技術開発において後者のパラダイムに位置づけてデータサイエンスを活用した成功体験から事例を選び、コンピューターを用いた問題解決法事例として説明する。
また、過去に多変量解析で解いた問題を比較のためにディープラーニングで解き、ビッグデータではない身近な問題では多変量解析が便利であることを示す。
また、弊社のセミナーでは多変量解析について、重回帰分析と主成分分析のプログラムコードを用いて解説する。すなわち数学的手順をプログラムの処理手順として説明し、数学の不得意な技術者でも理解できるように説明する。
なお、このプログラムコードは普及の始まったPythonで書かれており、すべて無料のモジュールを使用している。それゆえ、Python初心者には無料ライブラリーの活用テクニックをこのプログラム事例から学ぶことができる。
カテゴリー : 一般
pagetop