2026.02/19 データサイエンスの手法
データ解析を行う時にデータサイエンスの手法を使用するのだが、これが統計手法から深層学習まで様々あり、まず何を使用するのか選ぶ段階が、初心者には高い障壁となる。
・
その前に、すでにデータがある場合とこれからデータを取得しようという段階でも手法が異なってくる。これを情報工学の先生に問い合わせても良い答えが返ってこない場合もあるかもしれない。
・
少なくとも専門書でデータサイエンス入門と名がついた本を見ると、入門になっていない本がすべてであることに気づく。1979年にタイヤの計量化問題を担当した時に、データサイエンスと言えば多変量解析の時代だった。
・
このような時代であっても、どのような手法を選んだらよいのか、問題を正しく把握していない先生に質問しても難解な答えしか返ってこない。実際に情報工学の一期生が同じ問題をグループで担当していても彼は答えられなかった。
・
そこで、奥野先生の名著「多変量解析」を1冊購入し、6人で分担して読み、手法の議論から始めている。この時すでに気づいたのだが、データサイエンスというスキルは技術者全員が身に着けているべきスキルである、ということだ。
・
実際にデータ解析をしたい人がどのような答えを期待しているのか、一番よく理解しているのである。すなわち、自分が欲しい答えから解析方法を考えてゆく、というのがデータサイエンスのコツである。
カテゴリー : 一般
pagetop
