2023.08/14 重回帰分析のプログラム
回帰式を求めるだけならば数行でできるPythonのプログラミングだが、重回帰分析の使いこなしまで教えてくれない。また、それをChatGPTに尋ねると怪しい答えが出る。
質問の仕方で答えが変わるのを当方は楽しんでおり、その内容はAIいじめである。しかし、ネットを検索してみても、あるいは最近の「エクセルを使った多変量解析入門」という書籍を見ても、その解説内容に不満が残ったりする。
AIをいくらイジメてもその答えをお笑いで済ませることができるが、不十分な解説の教科書は、今時古本屋も買ってくれないのでゴミである。
1971年に奥野忠一らにより執筆された「多変量解析法」に勝る教科書に未だ出会ったことが無い。このような状況から、50年以上使われてきた多変量解析法は、科学と技術の境界に位置する学問だと理解させられる。
すなわち、多変量解析法を形式知としてとらえるには少し危ない学問である。奥野先生らの教科書はそのあたりを意識した書き方がされている。例えばあるパラメーターについて、「**ぐらいが適当である」と適当に書かれていたりする。
ゆえに教科書としていかがなものか、と思われる方もいるかもしれないが、形式知とならないところはそのように表現してくれれば読者はそのように適切に理解する。
それをすべて統計学による形式知のような表現をしている教科書が多いのが問題(昔、「統計でウソをつく」という本があったが)である。さらにエクセルのソルバーに至っては問題だと思う。ここは有料情報となるので書かないが、エクセルで多変量解析をやっている人はソルバーが吐き出す結果を見るときに注意を要する。
さて、重回帰分析のプログラムだが、Pythonでは良いあんばいにオブジェクトが設計されている。エクセルのソルバーのように「これこそ重回帰分析の結果である」と十分な答えを出さない。
先日この欄でPythonによる重回帰分析のプログラムを紹介しているが、重回帰分析結果は、すべてプログラマーの責任にゆだねられ、オブジェクトのふるまいはプログラマーが制御しなければいけない。
すなわち回帰式以外のユーザーが欲しい解析結果は、ユーザーがライブラリーに用意されたメソッドを一つ一つ実体として生成しない限り答えを出してくれない。ここが優れている。
カテゴリー : 一般
pagetop