2022.09/30 データサイエンスと技術者のスキル(1)
データサイエンスで用いられる多変量解析は、1970年代に体系として完成し、心理学や社会学でよく用いられるようになった。技術分野では、科学的ではないという理由で敬遠する科学にかぶれた技術者が多かった。
日科技連の新QC7つ道具にも採用されたが、それでも1990年代まで十分に普及しなかった。利用できるソフトウェアー環境が大型コンピューターに限られた状況も影響していると思っている。
PC9801が登場し、16ビットコンピューターが普及し始めて、多変量解析のソフトウェアーが数種販売されている。8ビットが普及していた時代にそのようなソフトウェアーは販売されていなかった。
当方は、MZ80Kを購入した時にFDOSも導入し、フロッピーをメモリー空間として使用した多変量解析のソフトウェアーを作成している。但し、10変数程度の重回帰分析で結果が出るまでに30分程度かかった記憶がある。
それでも大型のIBM3033を動かすことに較べれば、楽であった。IBM3033の場合には、依頼書を作成し、データはパンチカードで入力する必要があった。データを入力してもPOSシステムの合間の計算となるので、翌朝まで待たされる時もあった。
計算時間は早くても始まるまでに時間がかかったのである。それを考えるとデータを入力後30分で結果が出る環境は最高だった。
会社の独身寮だったのでプリンターの騒音も会社の仕事が免罪符となり、文句を言う同僚もいなかった。当時のユニハンマー方式によるプリンターの騒音はすごかったので段ボール箱をプリンターにかぶせていた。
しかし、コンピューターを自由に使えたおかげで、統計計算はじめ各種配合計算は簡単にできた。ゆえに当時の研究所ではQC手法が敬遠されていても統計計算をふんだんに取り入れて報告書が作成された。
喜んだのは上司である。CTOの前におけるプレゼンではQC手法でデータ整理されている必要があった。普段は科学的方法でデータ整理していたので、報告直前に必要なデータをQC手法に秀でた高卒スタッフを動員してデータのまとめなおし(捏造かもしれない)をしていた。
それが日常からそのようなデータが提供されたのである。発表前にわざわざそのためのデータ整理の手間をかけなくてもよくなったのだ。ただし、これらの成果は当方の年間給与の半分が投入されたシステムから出ていたのである。
カテゴリー : 一般
pagetop