「科学が正道を踏み外すさまざまなパターン」について迫る1冊だ。生命科学の歩みは決して止まってはいないが、無駄な努力のせいで進展は遅れている。単に時間や税金を無駄にしているだけでなく、人を欺く基礎研究の研究結果が、病気の治療法の探索を実際に遅らせているのだ。「人を欺く」と聞いてまず思い浮かぶのは研究不正の問題だが、ないものを「ある」ように見せるため故意に手を加えるような、明白なケース以外にも問題はあふれている。
科学ジャーナリストである著者が本書で焦点を当てるのは「再現性」の問題だ。不正とはまた別の、実験手法や結果の解釈の厳密さに問題があるケースが取り上げられる。実験の設計自体に不備があったり、データの解析が間違っていたり、得られたデータに都合よくなるような仮説を後づけしたり。そんなプロセスから生まれた論文が雑誌で発表され、鵜呑みにした研究者たちによって時には何千回と引用されることもある。再現性がないと後で判明しても、結果をベースにした研究すでに動いており、多大な労力と資金がつぎ込まれている(これも運よく後から気づいた場合の話だが)。
まず驚きなのが、再現できない研究が生まれるポイントの多さだ。実験動物の適切な数を選ぶ段階、どの結果を採用するかを決める段階、最終的に結果を解析する段階。いずれの段階も、さまざまな不確実性が入りこむ。生物医学分野の論文を調べたところ、235種類のバイアスが挙げられたとする調査も2010年に出ている。たいてい意図的ではなく、無意識のうちにバイアスに陥っているケースも少なくない。
2008年、非営利組織・ALS治療開発研究所が臨床試験の基になった研究を調べた。ALS研究の失敗率の高さは研究者の間でよく知られていたが、誰もその理由はよく知らなかった。調査の結果わかったのは、動物実験にひどい欠陥があったこと。多くの研究が、用いたマウスの数が少なすぎるために間違った結果にたどり着いていたのだ。十分な数のマウスを用いてあらためて実験したところ、どの薬もマウスで有望な結果を示さなかった。動物実験の段階で欠陥があると、それ以降のステップに費やした労力と資金が無駄になってしまう恐ろしい例だ。
マウスの取り扱いひとつとっても、結果を狂わせる要素は数多く存在する。マウスの雄と雌ではALSの発症率が異なるため雌雄のバランスに注意しなければならないし、すべてのマウスが遺伝的に同様かどうかも確認が必要だ。ケージを棚の一番下から一番上に移すだけでもマウスは恐怖心を募らせ、ストレスを感じて免疫力が弱まることもある。研究する上で本来は基本的な話であってほしいが、こうした配慮はしばしば抜け落ちていた。
実験そのものとは別の落とし穴として、データの取り扱いにも触れられている。データの収集・解析を行うたびに生じる誤差や、機器によって生じたノイズの部分を生物学的な差異として見てしまう「バッチ効果」の話は素人目に見ても明らかにアウトだ。「統計的有意」の意味を都合よく解釈してp値が0.05という基準を満たすための実験デザインをしたり、ちょうどいい値が出た時点で実験を止めたり、出た値に当てはまるような仮説を後付けで設定したりといったことも書かれている。事態を重くみたアメリカ統計学会が、p値にまつわる落とし穴について2016年に声明を出していることからもわかるように、これらはごく一部に限られた話ではない。
他にも、動物実験のそもそもの信頼性、細胞や抗体といった研究ツールを取り扱う際の落とし穴の多さ、作業の標準化の不徹底、ビッグデータに翻弄される様子など、広範な視点について膨大な事例をもとに切り込んでいる。詳細に立ち入るには字数が到底足りず、中途半端になるだけなので、ひとつひとつの話は手に取ってたしかめてほしい。「科学の進歩に失敗はつきもの」といった話とは次元が違うことは読めばすぐにわかる。「防ぎうる失敗」があまりにも多いこと、それこそが問題なのだ。
日ごろ報道されるような「研究成果」や「画期的発見」の底に潜む思わぬ脆さが、受け止めきれないくらいのボリュームと複雑さをもって突きつけられる。ただ、本書に出てくる多くの「落ち度」について科学者をただ責めるだけでは、事の本質は見えてこない。問題の核心は、背景にある構造の欠陥と、そこから生まれるインセンティブにこそあると著者は指摘する。
あまりにも多くの科学者があまりにも少ない研究資金を得ようと争い、あまりにも多くのポスドクがあまりにも少ない教授職を得ようと競い合っている。この2つの事実が、再現性の問題の根底にある。
拙速でも次々と論文を出す研究室の方が、より慎重な研究室より早く影響力を拡大させていくことを示したシミュレーション結果や、他所に出し抜かれるのを恐れてデータを共有したがらない(再現を試みることすらできない)研究者の姿を見ると、個人の問題では片付けられないことがよくわかる。資金難はいうまでもなく再現性に影響する。たとえば前半で触れた、多くのALS研究でマウスの数が少なかった話の背景には、研究室が持っている金額によってサンプルサイズ(動物数)が決まる(その数は厳密性に大きく関わる)という事情が存在する。
科学誌によって形成される評価システムの影響も大きい。インパクトファクター(商業上の目的のためにつくられた雑誌の格付けで、数値が高い雑誌に掲載される論文は引用回数が多く重要性が高いと一般に見なされている)は研究の質を示す代用指標としても利用されることが少なくないが、スコアが高い雑誌に載ったからといってその研究の厳密さが保証されているとは限らない。格付けの低い雑誌の方が査読がより丁寧で、微細なことまで書かれていると話す研究者もいる。さらに研究者としての将来という意味ではインパクトファクターの高い雑誌に載ることが当然期待されるので、ここにキャリアの問題も絡んでくる。
科学者が基準を上げ、それに従うインセンティブを作り出すためには、科学研究の社会的な状況が変わる必要があると著者は語る。「自分が公平な機会を得ていると思っている人は、あまり規則を曲げないだろう」と書かれている通り、根本の仕組みが変わってはじめて個人の意識も変わってくる。
多岐にわたる問題が構造の欠陥に収斂していく終盤のパートを読むと、研究費の確保やポスドクのキャリア問題といった聞き馴染みのある話題と再現性の問題が、分かちがたく結びついていることに気づかされる。つまるところこの問題は、社会が科学研究の世界に対してとってきたスタンスの写し鏡でもあるのだ。
日本の状況については、大阪大学蛋白質研究所の篠原彰教授による解説でフォローされている。「国内の関連する機関でも、研究のデザインや結果の解析など研究の厳密性に関するルールや、その教育について、話題に上ることも出てきた」としつつも、研究不正の問題に比べれば、まったくといっていいほど浸透しておらず、「厳密な研究を行うための責任ある”具体的な”行動を教える教育が皆無」なのが現状だという。
念押ししておきたいのは、問題点と変わらない力の込め方で、前向きな動きについても触れられていること。他の研究室の結果を再現することに特化し、その分野の信頼性を底上げしようと活動する研究機関。試験中に得られた結果をもとに、途中でアプローチを柔軟に変えていく適応的な試験デザインを模索する研究者ネットワーク。時に従来のやり方よりも予算が出づらいなどのハンデを背負いながら、厳密性確保のために奔走する人々の姿も本書は伝えてくれる。
最後に、「直感とはまるで相容れないように思えるかもしれないアイデア」として著者が語る内容に触れておきたい。
それは、医療の進展を加速させるためには、実際には生物医学研究のペースを落とすべきという考えだ。これは、取り組むプロジェクトの数を減らして、より注意深く研究するということを意味する。そして、科学文献では掲載する論文を減らす代わり、より入念になされた研究の論文を掲載することによって、科学文献の質を向上させるということでもある。
科学研究に対する期待値を「下げる」ことで結果的に、科学者だけでなく市民レベルも含めて良い循環が生まれると著者は主張する。病気の処置法や治療法の探索を1日でも早く待ち望む患者や患者支援団体にとっては複雑かもしれないが、「迅速」と「拙速」を区別することの大事さも強調される。
読み終えてまずは、科学の進展について日々飛び込んでくるニュースに一喜一憂しないようにしたいと思った。メディアや教育といった立場でこの分野に関わる人にもぜひ読んでほしい。着実な前進のためにはどのような研究のあり方が望ましいのか。背後にある構造はいかに改められるべきか。その外側にいる人々は、生み出された「成果」をどう受け止めればいいのか。再現性という視点から、そのヒントが見えてくる。
もうすぐ出るこちらは、よりシビアな内容になりそうな予感。