活動報告

新着記事

カテゴリー

キーワード検索

2023.01/25 機械学習

機械学習によるデータ処理が盛んにおこなわれるようになった。Pythonの無料ライブラリーが普及したためであるが、ディープラーニングだけがデータサイエンスの手法ではない。


50年ほど前から普及し始めた重回帰分析や主成分分析のような多変量解析でも同様の成果が得られる。非線形の問題ではディープラーニングに分があるが、線形領域の現象で回帰や分類を行いたいならばディープラーニングなど持ち出さなくても、データを弊社のサイトの欄に貼り付けるだけで答えが出る。


線形領域のデータが少ない問題ではなおさら多変量解析が有利である。単相関であれば3個以上データで回帰が可能である。さらに相関係数はじめ統計パラメーターによる考察も可能だ。


多変量解析も統計手法なので高校までの数学の知識があれば使用法の習得は簡単である。プログラムを作成するには、固有値はじめ線形代数の知識が必要になるので難しいが、Pythonの無料ライブラリを用いれば敷居は低くなる。


使うだけならば、エクセルにまとめられたデータを弊社の該当サイトに貼り付けるだけである。Javascriptでプログラミングされているので、動作はユーザーのブラウザ上のみである。


弊社がこのサービスを始めた背景は、マテリアルズインフォマティクスのブームでディープラーニング一辺倒の流れができたためである。線形領域の現象で回帰や分類を希望するならば多変量解析が便利である。


(注)現在のデータサイエンスについて、回帰や分類という処理を例に説明すると、50年以上前に登場し、大型コンピューターの統計パッケージとして用意されていた多変量解析がパーセプトロンを利用しディープラーニングまで拡張された分野という捉え方ができる。ややこしいのは世間に出回っている教科書の説明である。

カテゴリー : 一般

pagetop