2019年5月号掲載
データは騙る 改竄・捏造・不正を見抜く統計学
Original Title :STANDARD DEVIATIONS:Flawed Assumptions, Tortured Data, and Other Ways to Lie with Statistics
著者紹介
概要
「ビッグデータ」の分析、活用により、ビジネスや生活は大きく変わるといわれる。しかし、大量のデータとコンピューターが常に真実を導き出すとは限らない。世の中にあふれる一見もっともらしい数字や調査結果に、私たちはどう向き合えばいいのか? その見極め方、データとの向き合い方を、各種事例を交えて説く。
要約
パターン化による認知ミス
私たちはビッグデータの時代に生きている。大量のデータを分析して真実を見つけるという新たな技能の出現によって、政治やビジネス、医療、そして日々の暮らしは大きく変わるといわれる。
しかし、データとコンピューターは、時に突拍子もない答えを導き出す。例えば、まじめな人間がまじめな顔をして次のようなことを言っている。
- ・過去20年で、アメリカの犯罪率が50%も下落したのは、中絶が合法化されたからだ。
- ・1日にコーヒーを2杯飲むと、すい臓ガンになるリスクが大幅に上がる。
- ・送電線の近くに住んでいる子どもはガンになる。
こうした話は枚挙にいとまがなく、真実ではないにもかかわらず、新聞や雑誌で見ない日はない。
情報化時代に生きる私たちは、大量に流れ込む意味のないデータを基に考え、どうするかを決めている。間違った推論を立て、間違った決断を下していても不思議はない ―― 。
「予言タコ」に超能力はあったのか?
2010年のサッカーワールドカップの時、8試合を予想し、全試合で勝者を当てた、「予言タコ」パウルが話題になった。国旗を貼ったプラスチックのボックスに餌を入れると、勝利国のボックスを選ぶというもので、2008年のUEFA欧州選手権も含め、合計14試合中12試合を当てた。
統計学的に見ても、パウルに超能力があるのではないかと考えた人がいてもおかしくない。だが、タコに将来を見通す能力が本当にあるのか。
パウルはドイツの水族館にいたので、ワールドカップでは、決勝のスペイン・オランダ戦以外はすべてドイツが対戦する試合を予測した。ドイツが戦う13試合のうち11試合でドイツ勝利を予想し、ドイツは実際にそのうちの9試合で勝った。
パウルは対戦国を研究した上でドイツを選んだのか、それともドイツの国旗が好きだったのか。
タコはほぼ色盲だが、明るさは見分けることができ、横長の形を好むことがわかっている。ドイツの国旗は横に3分割され、鮮やかな色が配置されている。セルビアとスペインの国旗も同様で、パウルがドイツ以外に選んだのは両国だけだ。
ドイツとスペインの国旗はよく似ている。そのため、スペイン対ドイツの2試合のうち1試合でスペインを、そして決勝のスペイン対オランダでもスペインを選んだのだろう。パウルは勝つチームではなく、自分が好きな国旗を選んでいたのだ。
私たちはだまされるようにできている
パウルは単なるタコだったわけだが、なぜこれほど有名になったのか。答えは、パウルではなく、私たちの側にある。