2019.01/26 統計手法の危うさ
若いころに読んだ本で、「統計で嘘をつく」という、まさに今でも話題になりそうなテーマを扱った新書がある。当時ベストセラーになっているので神田の古本屋にあるかもしれない。ただし嘘は「ウソ」とカタカナ表記になっていたかもしれない。
この本を読んだときに、たいした内容ではないと思い無造作に扱って紛失したが、厚生労働省の今回の事件で、著者の意図を再確認した。ニュースでは伝えられていないが、お役人レベルの能力があれば、このような知恵は十分に回る。すなわち、歴代の事務次官レベルが逮捕されてもよい事件である。
但し、甲南大法科大学院の園田寿教授(刑事法)は「意図的な捏造(ねつぞう)や改ざんではなく、単に申し送りで漫然と続けていたなら、故意だったと認定するのは難しい」と説明する。漫然と続けていたなら許される、というところが気にかかる。
国民の税金が給与として支払われているのである。年金が源泉徴収され、そのような漫然と仕事をやっている役人に給与として支払われているのかと思うと、空しくなる。
さて、今回この問題を日々の品質管理活動や研究開発活動にあてはめて考えてみたい。話を簡単にするために抜き取りサンプル5個の平均と標準偏差を管理しているとする。
この時抜き取りサンプルを6個に増やし、測定値を見ながら、平均値や標準偏差を操作することが可能である。あるいは、抜き取りサンプル5個の統計データに不満があれば、自分の満足行くデータとなるまで抜き取りを繰り返し、都合の良い5個の抜き取りサンプルでデータを整えることもできる。
さてこのようにして収集された統計データは、正しいと言えるか。またこの行為は捏造ではないので許されるのか。学生時代、このような話を読んだ時にあまり真剣に考えなかった。
同じ悪事を行うのであれば、5個のサンプリングよりも面倒なことをする人がいるのか、それならばサンプリングもせず適当な数値を書いた方が面倒ではない、という感覚からである。
なぜなら学生実験であれば多少データが皆とずれていても、あるいは収率が悪くてもサンプル数を増やす方法など考えず、サンプリング5個のところを1個にして、n=1と添え書きをつけておいて、早く実験を切り上げ雀を追いかけていた。、n=1と添え書きをつけていたので、手抜きの減点はあっても捏造ではないのでレポートとして許された。
すなわち、その目的はともかく、統計処理を行うのは、自然界のすべてのサンプルを調べることが不可能なので一部のサンプリングで数値を代表させる、と信じており、統計数値で悪事を働くぐらいならば捏造を行うだろうと思っていた。
しかし、著者は、統計処理を悪用して数値を操作し、悪事を働くことができる問題を情報化時代の到来の前にテーマとして取り上げ警鐘を鳴らしていたのだ。この著書が販売されたときに、誤った統計処理を放置した場合には犯罪であると法整備をしていたならば、今回の事件はアウトである。
今やビッグデータ含め、統計データが身の回りにあふれ出しており、そしてそれらが日常生活に影響を与え始めた。情報化時代とは、統計の時代でもある。そのような時代に責任のある立場の人間が漫然と統計データを扱っていても許される、というのは法律が時代に合っていないように思う。
ところで故田口先生はタグチメソッドは統計手法ではない、とおっしゃっていた。タグチメソッドでは、基本機能に影響を及ぼさない制御因子をチューニング因子として使うことができる。
これは便利な考え方であり、逆にタグチメソッドを統計手法としていたら、このような考え方は統計で嘘をつくことに近い行為でメソッドが怪しくなる。タグチメソッドは統計手法ではないのでそれが許されるのだ。
確認実験が外れても当てはまるまでチューニング因子を活用しSN比の高い条件を見つけることは禁じ手ではない。なぜならタグチメソッドの目的にカイゼンがあるからだ。故田口先生はそこまで深読みされてタグチメソッドを完成された。メソッドを理解すると、改善できれば何でもありの世界が見えてくる。
カテゴリー : 一般
pagetop