誰もあえて口にしないが、相関関係のモデルが導き出した予測の大半は間違っている。

解説

 今日、多くの企業が巨大なデータベースをもとに、顧客行動の分析を進めている。
 例えば、小売り大手のターゲット。同社は「母親になる女性」という顧客層の売上を増やしたかった。そこでデータサイエンティストが、買い物客の「妊娠指数」を評価する予測モデルを作成した。これは、出産前の女性が購入する傾向が高い25種類の商品を選び、その購入額をもとに妊娠している可能性を計算するものだ。
 予測モデルを構築する際は、大勢の顧客の「購入履歴」を調べる。すると、あちらこちらで繰り返される購入パターンが見つかる。例えば、特大のバッグを買った人の多くが、後にベビーベッドを買っているかもしれない。
 予測モデルが選んだ25の商品とベビー用品の関係を証明するために、アナリストは大量の購入履歴を精査する。ある人の購入履歴が、妊娠が予想される顧客グループの購入パターンと似ていれば、その人は妊娠しているだろうという予測が成り立つ。この「似ている」人のアプローチは、あらゆる予測モデルの基本となる。
 だが、ある商品をどうして買ったのか、その本当の理由を計測することなどできるのだろうか。
 一般に社会科学の統計モデルは、人間の行動の理由ではなく、相関関係をもとにしている。しかし、現実世界の相関関係は、物理学の法則などとは異なり、一貫性とはほど遠い。あなたがきょう緑色の傘を持っているからといって、次に買う傘も緑色とは限らない。つまり、統計モデルは因果関係を無視したものなのだ。
 この構造的な限界は、データがどれだけ大量にあっても乗り越えられない。

このTOPPOINT NOTEを読んだ方は、
他にこんな記事にも興味を持たれています。

新刊ビジネス書の
要約を紹介する月刊誌
『TOPPOINT』
本誌を
サンプルとして無料
お送りいたします。

  • book01

    熟読

    毎月大量に発行される新刊ビジネス書や、文化、教養に関する新刊書などを、100冊前後吟味します。

  • book02

    厳選

    熟読した本の中から特に「切り口や内容が新鮮なもの」「新たな智恵やヒントが豊富なもの」10冊を厳選します。

  • book03

    要約

    読者の方が、本を購入される際の「判断基準」となるよう、原著の内容を正確に、わかりやすく要約します。

購読者の約7割が、経営者および
マネジメント層の方々。
購読者数は1万人以上!
その大半の方が、6年以上ご愛読。

まずは、1冊無料試読
TOPPOINT編集部厳選「必須のビジネス名著100選 2024年選書版 オールタイムベスト10ジャンル×10冊」を1部無料謹呈! TOPPOINT編集部厳選「必須のビジネス名著100選 2024年選書版 オールタイムベスト10ジャンル×10冊」を1部無料謹呈!