大論説委員も統計のウソの意味が分かってない2019年02月06日 11:48

 先週、毎日新聞の論説委員がマーク・トウェインの統計とウソに関する格言を引き合いに出し、今週は、朝日新聞の編集委員が「統計でウソをつく法」を引用していた。国会でも連日話題の厚労省不正統計になぞらえての話だが、どうもこの2人には科学する心がないらしい。
 今回の統計不正と、「統計でウソをつく法」は意味が違うのだ。
「多くの統計は、額面通り受け取るとウソばかりである。統計は、数字という魔術によって、人々の常識を麻痺させる」という「ウソをつく法」の一説が出ていた。
 「統計でウソをつく法」とは「正しい統計で、間違ったことを事実と思わせるだましのテクニック」という意味だ。サンプリングなどを数学的に正しいやり方でやったまともな統計データであっても活用の仕方で人々をだませる悪用法を指す。厚労省のようにデータ自体に不正な操作を加えたり、間違った方法で統計を取ることは統計でウソをつく事にならない。それはただの間違った統計だ。データ自体をねじまげていいなら、わざわざ統計のトリックを使わなくても、何に関してだって、ウソをついてだますことができる。

 統計でウソをつくというのは例えばこんな方法だ。

 毎日コーヒーを飲む人と、まったく飲まない人を10年間追跡調査したら、飲む人の方が3倍も多く肺がんになった。だから、コーヒーには発がん性がある。
 これが間違いである理由はサンプリングや検定の方法が数学的に厳密であるかどうかと関係ない。コーヒーを飲む人は飲まない人に比べて、喫煙者が多く、飲まない人には非喫煙者が多い。肺がんが多い原因はコーヒーではなく、喫煙にある。非喫煙者だけでコーヒーを飲む人と飲まない人を比べたらほとんど差は出ないだろう。これはよくある相関関係を因果関係にすり替える方法。だましの基本テクニックだ。

 厚労省の統計不正は、統計を悪用したウソではない。そもそも統計の取り方自体が数学的に間違っているので、文書やデータの捏造にあたる。事例としては高血圧薬ディオバンの論文不正に近い。製薬企業の社員がディオバンの試験をしている医療現場から集めた生データに対し、狭心症や心不全を防ぐ効果が高くなるよう改ざんを加えて、論文を書かせたという事件だ。

 繰り返す。統計のルールに従わずに恣意的にデータを集めたり、データを後になってから都合良くねじ曲げていいなら、どんなウソでも可能であり、それは「統計を悪用したウソ」とは意味が違う。