おすすめ本レビュー

『ベストセラーコード 「売れる文章」を見きわめる驚異のアルゴリズム』コンピューターによる文芸批評の時代

西野 智紀2017年5月31日

HONZが送り出す、期待の新メンバー登場! 西野智紀は24歳の若きレビュアーだ。産経新聞、週刊読書人などで執筆をしつつ、将来的には書評家一本でやっていきたいという夢を持っている。デビュー書評がいきなりカブるという悲劇に見舞われたが、これが吉とでるのか、凶とでるのか。今後の彼の活躍に、どうぞご期待ください! (HONZ編集部) 

ベストセラーコード 「売れる文章」を見きわめる驚異のアルゴリズム

作者:ジョディ・アーチャー 翻訳:川添節子
出版社:日経BP社
発売日:2017-03-23
  • Amazon
  • Amazon Kindle
  • honto
  • e-hon
  • 紀伊國屋書店
  • HonyzClub

売れる小説を書きたい――作家を志す人ならば、一度は妄想する夢だろう。印税収入だけで暮らしていけたら、人生どんなに楽なことか。しかし、当然のごとく世の中は残酷で、運よくデビューできても、ロクにヒットも出せぬまま消えていくケースなどいくらでも存在する。ましてや今や出版不況、売れない文芸作家に対する風当たりは一段と厳しい。

そうした非情な現実の嵐に懊悩するあなたの耳元で、本書はささやく。実はベストセラー作品には、黄金の法則があるのですよ。しかもこれは評論家や批評家の主観的評価ではなく、最新のコンピューター・プログラムが弾き出した客観的データの集成であり、このアルゴリズムを通せばなんと80%の確率で売れるか否か判別可能なのです。それをあなたに特別にお教えしましょう、と。

……少々胡散くさい書き方をしてしまったが、本書『ベストセラーコード』は、タイトルに偽りなく、ベストセラーとなった小説の「売れる法則」をコンピューターで解き明かした一冊だ。
それでもなんだか眉唾だ、と思う向きがいるかもしれないので、フォローすると、著者は二人ともアメリカのバリバリの文学研究者で(ジョディ・アーチャーは元文芸研究員のフリージャーナリスト、マシュー・ショッカーズは計量文献学とテキスト・マイニングの第一人者)、この本を記す前提として、個人的な意見を一切差し挟まないことを保証している。つまり徹底して真面目な研究書なのである。

具体的なコードの内容に入る前に、彼らがどのような分析をしたか簡単に説明をしよう。まず、ニューヨーク・タイムズ紙のベストセラーリストから、ヒットした小説を500冊チョイスし、売れ行きが芳しくない小説4500冊と合わせて分析し、テキストの特徴を抽出する。観点は、Iやhimといった単語が使われる頻度や、単語の持つ意味(ポジティブかネガティブか)の振り分け、扱われるトピックの分類など。

この「テキスト・マイニング」と続けて行われたのが「機械学習」だ。これはテキスト・マイニングによって得た特徴を入力して、ベストセラーになるかどうかを予測するプロセスである。これらの解析の中にはコンピューターへ強い負荷が掛かるものもあり、著者らは1000台のコンピューターを用意し一度に1000冊処理する体制を整えたが、それでも4年の歳月を要したそうだ。
では、この惜しみない労力の結果を見ていこう。

はじめは、文章中に含まれるトピック。アメリカでヒットした小説は、「弁護士と法律」「家庭の時間」「愛」「チームスポーツ」といった、日常生活に即したトピックを盛り込んでいる。興味深いのは、ベストセラー作家は、トピックを3つか4つ程度しか入れないのに対し、売れない作家は情報をやたらと詰め込む傾向があることだ。要するに、話があっちこっち飛ぶ作品はウケが悪い。

また、このトピックの条件をクリアしている例として挙げられているのが、『フィフティ・シェイズ・オブ・グレイ』だ。「ひどいポルノ小説だ」として作家や評論家からこき下ろされた大ベストセラーだが、実は大衆の心を巧みにつかむ三幕構成となっており、登場人物(と読者)感情の浮沈をグラフ化すると、あの『ダヴィンチ・コード』とほぼ一緒の波形を描くというのだから驚きである。ベストセラーは物語の基本をしっかり踏襲しているというわけだ。加えて著者らは、売れる作品のプロットラインを7つに分類している。

分析はさらに微に入り細をうがっていく。たとえば、ベストセラーは、冒頭の一文から惹き込んでくる。本文中で例示されているスティーヴン・キング『シャイニング』(深町眞理子訳、文藝春秋)を引用してみる。

Jack Torrance thought: Officious little prick.
(鼻持ちならん気取り屋のげす野郎め、というのがジャック・トランスのまず感じたことだった。)

たった6語で、二人の人間の対立をリズミカルに示唆している。なにより、人物の声がすっと入ってくる。売れる小説は、全般的に、余計な言葉を挟まず、I’dやyou’reといった縮約形も駆使して、短く簡潔に書かれている。これは、私も訓練しているが、小説のみならず、人に読ませる文章を書くうえで欠かせない技術である。

「読ませる」観点でいくと、魅力的なキャラクター造形も不可欠だ。ベストセラーの主人公は、必ず何かを必要とし(need)、何かを求めている(want)。売れない小説は、この二単語の使用頻度が低く、消極的なフレーズが多い。

さらに対照的なのが、売れる小説の主人公は、主体性の高い言葉との結びつきが強く、行動的であることだ。実行する(do)、考える(think)、達成する(reach)といった動詞が典型的だ。このデータは、『ミレニアム』シリーズや『ゴーン・ガール』、『ガール・オン・ザ・トレイン』などのダークヒロイン小説ブームを下支えする要素だと著者らは指摘する。

さて、ざっくりとデータを見てきたが、それなりに小説を読んできた人からすれば、どれも感覚として理解している話かもしれない。だが、最初にも述べたけれど、小説の評価を定量的かつ客観的な証拠として示せたのは大きいし、ひじょうに興味深い。

ただし、言わずもがな、これはアメリカの文芸出版市場が舞台である。日本にそっくりそのまま転用とはいかない。しかし、本書を監修している統計家の西内啓氏によれば、著者らの行った解析を日本国内でもビジネスとして可能だそうで、出版関係者でお悩みの方はご相談ください、とのこと。

それにしても、コンピューターが人間の創造性までソートできるようになった事実には唸らざるを得ない。AIが小説を書いたというニュースも記憶に新しいし、揉み手をしつつAI先生とアルゴリズム先生のご機嫌うかがいをする日は近そうだ。