爽風上々のブログ

熊本の片田舎に住むリタイア読書人がその時々の心に触れたものを書き散らしています。読んだ本の感想がメインですが(読書記録)、エネルギー問題、食品問題など、また政治経済・環境問題など興味のあるものには触れていきます。

「この本を書いたのは誰だ? 統計で探る”文章の指紋”」村上征勝著

人の書く文章にはその人なりの癖がどうしても出てしまうものでしょう。

同じ人の書いた文章だと言われても違和感を感じることはあります。

その「違和感」が感覚だけでは説得力はないのですが、そこに統計学の手法を取り入れて分析をすると裁判などでも使えるほどのデータが出るということです。

 

このような、「文献に対する統計分析」という学問は、すでに1887年にメンデンホールにより発表された論文で始まっています。

それまでは「偽作」と言われるものがあっても、「何となく変」といった感覚的な表現しかできなかったのですが、それ以降は様々な統計的手法を使って検討するということが次々と行われるようになりました。

 

このような検討は色々な分野で行われていますが、それを第1章「犯罪事件編」第2章「文学作品編」第3章「政治・哲学編」第4章「宗教編」に分けて説明されています。

 

1984年に起きた「グリコ・森永事件」は大きく報道され注目を集めました。

結局は未解決のままとなったのですが、犯人から送られたと言われる脅迫状も特異なものでした。

かい人21面相」と名乗り、ほとんどひらがなで関西弁で書かれたものは特徴的でした。

作家たちもそれについて色々な推理を発表しているのですが、推理作家の内田康夫やノンフィクション作家の一橋文哉の著書では「脅迫状の文書の印象から見ると犯人は二人以上いた」と書いています。

しかし、そういった印象から見るだけでなく、本書主題の「統計的手法による分析」を施せばどうなるかということがその後に説明されています。

「空白数のバラつき」「助詞の出現率のバラつき」を見ると、やはり前半と後半のものには大きな違いが存在し、内田・一橋の推論と同様の結果となります。

とはいえ、科学的と考えられる手法でその結果が得られるということは大きな成果と見られます。

 

1769年イギリスで、当時のグラフトン内閣の政治を痛烈に批判した「ジュニアス・レターズ」という投書が大きな話題となりました。

この「ジュニアス」という仮名を使った人物が誰なのかということは分かっていませんが、多くの人々がその推理を行ないました。

当時の政治家フィリップ・フランシス卿が有力ですが、それ以外にも40人以上の名前があがっているそうです。

それについて1962年になってA・エレガードという研究者が識別指標法という新しい手法を用いて分析しました。

当時の別の文書などを大量に分析し、その時代の平均的な「好まれる単語」「好まない単語」を統計量として算出し、それに対し目的となる文章の中のその単語の使用頻度を比較するというものです。

これを実施した結果、ジュニアスの単語出現頻度はフィリップ・フランシスと非常に一致度が高く、他の候補はそれより低い一致度であったということです。

 

英語の文章の作者の好みが現われるものとして、モステラーらは「20種の単語の出現度」を測るという方法を提唱しています。

その単語は「upon,although,commonly,consequently,considerable,enough,while,whilst,as,at,by,of,on,there,would,innovation,language,vigor,voice,destruction」だということです。

 

このような分析の手法は言語によって、そして年代によって大きく違ってくるようです。

聖書を対象として行われている分析では当時のヘブライ語の特徴である、接頭辞の出現率を測るということが行われました。

接頭辞とは英語でいえば「Unknown」の「un」に相当するもので、古代ヘブライ語では書き手の癖がもっとも顕著に表れると言われています。

この分析により、「イザヤ書」の7つのセクションはすべて同じ作者によって書かれたと結論づけたのですが、実は他の研究者の解析では「聖書のすべての章」においてその特徴は共通であったようです。

つまり、「書き手の癖が現われる」とした前提条件が誤っていたようです。

 

実はこのような「文章の指紋」というものは、個人の特徴が出るようでもあり、そうでない場合も無いとは言えないというもののようです。

まず、言語の違いというものが非常に大きなものです。

また同じ言語でも時代によって大きく変わってきます。

さらに文章の種類で宗教関係か文学か政治か哲学か。

韻文と散文も大きく違います。

 

また書き手自身が気が付いていない場合もありますが、年齢によって特徴が徐々に変わってくることもあります。

人生の大きな岐路があった場合も文章は変わります。

源氏物語の作者は紫式部であるということは、紫式部日記など他の文章からも間違いないことと言われていますが、ただし後半部は文章が少し違ってくるそうです。

そのため、後半は別の作者が居るのではないかとも言われています。

しかし、瀬戸内寂聴さんによれば「紫式部は後半を書く前に出家したのではないか」ということです。

これは御本人の体験から出家というものが人間の心性を大きく変えるものだということが分かっているからで、紫式部にも同じようなことがあったのではということです。

 

中々興味深い視点ですが、ちょっと不安定な推論となるのではとも感じます。