2022.07/30 データサイエンスの意味
効率的な実験を目指すと、実験数が少なくなる。STAP細胞の騒動が起きたときに理化学研究所のある理事がたった一個のデータでよいからSTAP細胞ができたことを示してくれと発言をしていた。
結局その一個のデータが得られなかったので否定証明が展開され、STAP細胞は存在しないことになった。もしここでSTAP細胞ができた1個のデータでも得られたならば、STAP細胞の存在が証明されたことになる。
すなわち、仮説を設定して行う実験では、仮説の正しさを示す1個の実験データさえあれば良いことになる。その一個がどのような経緯で見出されたかは、厳しく問われない。再現性さえあれば良いのだ。
例えば4種類の遺伝子の組み合わせで細胞の初期化を行うiPS細胞の技術では、ただ1種類の組み合わせのヤマナカファクターについて論じた論文がノーベル賞の対象となっている。
この論文について山中博士が語っていたことは省略するが、科学では仮説が真であることを示すたった一つのデータがあれば良い。
イムレラカトシュはこの論を展開して、完璧な科学的証明とは否定証明だけである、と述べている。換言すれば、否定証明以外には非科学的要素が存在することを意味している。実際にヤマナカファクターの発見プロセスはあみだくじ方式であり、山中博士はそれで当たりを引いたのである。
一方ビッグデータを用いるデータサイエンスは科学的と言えるか。データサイエンスにおけるデータの取り扱いは数学で進められるので科学的と言えるかもしれない。ここから先は8月22日の技術情報協会で行われるセミナーで解説したい。
カテゴリー : 一般
pagetop