Pythonで学ぶデータサイエンス
<概要>
1970年代に大型コンピューターで多変量解析を利用できるようになり、人文科学系研究のデータ活用レベルを飛躍的に高めた。データサイエンスの黎明期であり、マイコンの登場もあって1970年末には情報工学科設置ブームが大学で起きている。ところが、日科技連から公開された新QC7つ道具に多変量解析が紹介されながらも、技術開発ではデータによる演繹的推論よりも仮説を重視した実験データを積み上げる帰納的推論で研究開発が行われた。すなわち、データは仮説を直接実証する目的で収集され、データサイエンスの手法は技術開発において一部の統計手法以外利用されなかった。
2010年初めに登場したマテリアルズインフォマティクスでは、AIを活用したデータマイニングが注目され、2017年には大学でデータサイエンスの講座設置ブームが起きている。
データサイエンスに半世紀以上の歴史があっても、その手法を用いた問題解決法がこれまでの仮説中心の科学的な手法とは異なるゆえに、これを技術開発に応用するときに戸惑う技術者は多かったのではないか。また、一口にデータサイエンスと言っても多数の手法があり、例えば多変量解析だけでも2種類以上解析手法が存在する。
本セミナーでは、データサイエンスを用いる開発手法が、従来の科学的手法と異なる点に着目し、科学と技術の相違点ゆえに開発スピードの向上と独創性を生み出す手法として利用できる長所を解説する。
すなわち、問題解決手法には科学的問題解決法と非科学的問題解決法の二つのパラダイムが存在する。30年以上の技術開発において後者のパラダイムに位置づけてデータサイエンスを活用した成功体験から事例を選び、コンピューターを用いた問題解決法事例として説明する。また、過去に多変量解析で解いた問題を比較のためにディープラーニングで解き、ビッグデータではない身近な問題では多変量解析が便利であることを示す。
また、本セミナーでは多変量解析について、重回帰分析と主成分分析のプログラムコードを用いて解説する。すなわち数学的手順をプログラムの処理手順として説明し、数学の不得意な技術者でも理解できるように説明する。なお、このプログラムコードは普及の始まったPythonで書かれており、すべて無料のモジュールを使用している。それゆえ、Python初心者には無料ライブラリーの活用テクニックをこのプログラム事例から学ぶことができる。
<対象>
高卒以上の中堅技術者
新入社員技術者研究者
データサイエンスと機械学習に関心のある技術者
研究開発の管理者、実務担当者
データサイエンスを学びたい技術者
<目次>
1.データサイエンスと問題解決法
1.1.そもそも問題解決とは
1.2.科学と技術について
1.2.1.iPS細胞の開発
1.2.2.トランスサイエンス
1.3.データサイエンスとは
1.4.データ指向の思考方法
1.4.1.コンピューターと問題解決法
1.4.2.事例:半導体無端ベルトの開発
1.4.3.事例:データ駆動による再生材の開発
2.データサイエンスとAI
2.1.機械学習の概要
2.2.機械学習の分類
2.3.ディープラーニング
3.データサイエンスとPython
3.1.Python概論
3.2.Pythonの無料ライブラリー
3.3.Python自動処理プログラム
3.3.1.Python自動処理概論
3.3.2.事例:エクセルファイルの整理
4. 統計手法について
4.1.統計手法の復習
4.2.新QC7つ道具
4.3.直交表について
4.4.事例:前駆体法による高純度SiC開発
5. 多変量解析
5.1.多変量解析概論
5.2.重回帰分析
5.2.1.重回帰分析プログラム(Python)
5.2.2.事例:重回帰分析による高分子の難燃化技術開発
5.2.3.事例:重回帰分析とディープラーニングによる回帰の比較
5.3.主成分分析
5.3.1.主成分分析プログラム(Python)
5.3.2.事例:電気粘性流体の耐久性問題
5.3.3.事例:顧客ブラックボックスの見える化
6. タグチメソッド(TM)
6.1.TMの全体像
6.2.事例:難燃性再生材開発
6.2.1.事例説明
6.2.2.L18実験解析プログラム(Python)
7.まとめ
<添付補助資料:巻末に添付>
1.Pythonの環境構築
2.Pythonの文法
お申込みはこちら