タイトルの割に中身は真摯『誰もが嘘をついている ビッグデータ分析が暴く人間のヤバい本性』

2018年3月4日 印刷向け表示
  • このエントリーをはてなブックマークに追加
誰もが嘘をついている ビッグデータ分析が暴く人間のヤバい本性

作者:セス・スティーヴンズ=ダヴィドウィッツ 翻訳:酒井 泰介
出版社:光文社
発売日:2018-02-15
  • Amazon
  • honto
  • e-hon
  • 紀伊國屋書店
  • HonyzClub

2015年、米カリフォルニア州サンバーナーディーノで銃乱射事件が発生した。パキスタン系アメリカ人でありイスラム教徒だった犯人の名前が報じられるやいなや、ネット上はイスラム教徒を殺害せよという書き込みで溢れかえる。

事件の4日後、オバマ大統領(当時)は国民向け演説で「差別を拒むことは、宗派を問わずすべての米国人の責務」と語り、「自由は恐怖に勝ることを忘れないよう」呼びかけた。「タフで冷静」、「恐怖に判断力を曇らせられないよう促した」。人々の良心に語りかけ、受容と寛容の重要性を説いた演説はメディアに称賛された。

しかし、著者らがグーグル検索のデータを分析したところ、異なる実態が浮かび上がってきた。イスラム教徒を「テロリスト」、「悪人」、「暴力的」、「邪悪」などのワードと結びつけた検索が、演説終了後に倍増していたのだ。

本書は、グーグルのデータサイエンティストや大学の客員講師などを勤めてきた人物が、データ分析が浮き彫りにする事実やそのインパクトについて縦横無尽に語った一冊である。著者がメインに取り組むグーグル検索分析を中心に、大規模なデータを活用した調査の数々を紹介していく。

冒頭に取り上げたような政治関連でもう一例挙げたい。著者曰く、「クリントン トランプ 公開討論」と検索があった場合、検索した人が選挙でクリントンを支持する可能性は高い。両候補を含む検索においては、支持候補の名前を先に入力することの方がはるかに多いというのだ。実際、2016年アメリカ大統領選において、クリントンが勝つと見込まれていた中西部の重要州では「トランプ クリントン」検索の方が「クリントン トランプ」検索よりも如実に多かった。番狂わせとなったこの地域での勝利は、トランプ当選に大きく寄与している。

グーグル検索は、他人に言えない悩みや疑問が露わになる場所でもある。米国人は実売量をはるかに上回るコンドームの使用量を申告しており、さらにセックス回数自体も過大申告されがちであることが調査によって判明したという。性に関する悩みの方向も男女で異なり、セックスレスについて検索するのは女性の方が多い一方、男性は「ギターのチューニング法、オムレツの焼き方、タイヤの交換法を調べるよりも頻繁に」アソコの増大術について調べているそうだ。政治から性事に至るまで、本書で繰り出される話題は幅広い。

知られざる人の本性を明らかにし、通説や直感が覆される事例を軸に進む本書だが、その軸とは少し違う側面にも触れておきたい。少なくとも、単なる事例集ではない。トピックの一つひとつを読んでいると、データ分析そのものの魅力まで伝えたいという著者の意思が伝わってくるのだ。

数々の事例を通して意識させられるのは、何が有効なデータになるかわからないことの興味深さである。著者が引用している、統計学者ネイト・シルバーの調査はその好例だ。同調査は、共和党候補の予備選においてトランプの支持に最も相関性の高い、意外な指標の存在を示した。それは失業率でも銃所有率でも移民率でもなく、差別用語「ニガー(nigger)」の検索回数だった。なお、ヒップホップの歌詞に出てくる「ニガ(nigga)」とのスペルの違いはきちんと区別した上での結果である。

データ分析そのものを楽しんでいる著者の様子が伝わってくるのもいい。大の野球好きが昂じて始めた調査では、成人男性がどの球団の贔屓になるかは8歳の時の優勝チームに左右されやすいという傾向を見出す。分刻みの分析が持つ威力を語る時には、バンクーバー五輪のアイスホッケー決勝、カナダ対アメリカ(カナダ人の80%が見たとされる)放送時におけるエドモントン市の分ごとの水使用量グラフを出し、各ピリオド終了直後に「明らかにエドモントン中のトイレが流された」ことがわかるとアピールする。「これは私のお気に入りの研究だ」と随所で一言はさんでくることからも、純粋に好きでやってますという感じが出ていてほほえましい。

とはいえデータ分析の素晴らしさばかりを説くわけではない。その限界についても紙幅が割かれている。証券市場の推移をデータで予測しようとする試みは、影響を及ぼす変数があまりに多すぎるためにうまくはいかないという。ビッグデータはあくまで補完的な立ち位置で、人間的な判断力はもちろん、アンケートなどの小規模なサーベイも組み合わせることが重要だと著者は語る。Facebookですら、大量のデータだけでなく、数百人規模の小さなアンケートを行って得たフィードバックを活かしているのだ。

データを活用する側の倫理も問われる。融資の申込み理由を書く際に使われる言葉を分析することで、借金が踏み倒す人ときっちり返す人がそれぞれ使う傾向にある言葉が見えてくるという。年齢や性別、郵便番号、来店頻度などの顧客データから、これ以上損すると懲りて足が遠のくという「痛点」を推定して個別にアプローチを変えていこうとする大手カジノ企業の取り組みもあるそうだ。口コミサイトなど企業側も評価される仕組みがあるのでお互い様な面もあるが、データによる行き過ぎた選別によって不利益が生まれる可能性は拭えない。

データが示す結果は時に残酷ですらある。始めに挙げたような、良心的演説がかえってヘイト感情に火をつけてしまった話なども一つの例だろう。それでも、真実から学ぼうという姿勢があればデータ分析は心強い武器になると著者は説く。

実は冒頭のオバマの話には続きがある。怒れる人々への説教は逆効果になることを示した演説の後日、彼はテレビ中継された別のスピーチで再び同じ話題について触れたのだ。ただし今度は、話す内容に明らかな変化が見られた。

アフリカから連れられてきた奴隷の多くはイスラム教徒だったこと、シカゴの摩天楼を設計したのはイスラム教徒だったこと……。さらにはイスラム教徒のスポーツマンや軍人、警官、医師、教師などの存在についても語られた。寛容の価値などにはほとんど触れず、聴く人の好奇心を掻き立てながらイスラム系アメリカ人への認識を変えることに専念したこの演説は成功だったと著者は語る。グーグル分析の結果は、イスラム教徒へのヘイトや怒り交じりの検索が、スピーチの数時間後にわたって大幅に減ったことを示していた。残酷な真実の前に立ちすくむのではなく、そこから学ぼうとすることで、前向きなデータの使い方ができる。

貧困層が長生きしやすい都市の特徴とは? 有名校にぎりぎり受かった人と僅差で落ちた人の将来に差はあるのか? 著名人を輩出する確率が高い地域の共通点とは? 会話で「脈あり」の時に無意識に使われている言葉とは? といった興味深い事例が散りばめられた本書だが、著者のデータ分析への向き合い方も含めて味わってほしい。全体を貫いているのは、データをポジティブに使っていこうする姿勢である。

国や地域ごとに結果が大きくばらつきそうな調査や、相関はあるけど因果関係は微妙じゃないかといった例には気をつけて読む必要があるだろう。それらを踏まえた上で、煽り気味なタイトルの印象とは裏腹に、データ分析の魅力や適切な距離の取り方を伝えてくれる1冊としておすすめしたい。

決定版-HONZが選んだノンフィクション (単行本)
作者:成毛 眞
出版社:中央公論新社
発売日:2021-07-07
  • Amazon
  • honto
  • e-hon
  • 紀伊國屋書店
  • HonyzClub

『決定版-HONZが選んだノンフィクション』発売されました!