2023.09/29 まず何から学ぶか(2)
統計手法を正しく理解することは、データサイエンスにおいて大切なことである。しかし、この全体を習得するには3年かかるだろうと思われる。専門に勉強しても1年半はかかる。これは大学のカリキュラムを見てみれば理解できる。
当方の学生時代に統計学について2単位は必須であったが、残り4単位は選択となっていた。当方はカリキュラムのすべてを習得しただけでなく、文学部で行われていた心理学における統計学の応用の学問も教養部時代に学んでいる。
幸運なことに大学院では授業料が免除されたが、学部では授業料を支払っていたので、取得できる単位をすべて取得しようと努力した結果である。その結果、単位をとりすぎて教務課から注意を受けている。
このような学生時代に学んだ経験から、統計学について何が重要であるのか公開したい。すなわち、それを学び理解できたならデータサイエンス全体の学習に入ることが可能となる。
最近のデータサイエンスに対する説明を読むと統計学は、データサイエンスの一部として扱われている。しかしこのようなとらえ方そのものが誤解を生むことになっている。
まず、統計学とは何か、という教科書に数ページ書かれていることをしっかりと理解することだ。そうするとサンプリングの重要性に気がつく。
もし、タグチメソッドを実務で使われてきた方ならば、この気づきでノイズの水準がなぜ必要なのか理解できるはずだ。調合誤差まで設計して実験をしなければいけない理由に気づけばサンプリングについて理解できたと思ってよい。
カテゴリー : 一般
pagetop