Google Ngram Viewer とは
「世界中の情報を整理し、世界中の人々がアクセスできて使えるようにする」ことを会社のミッションとするGoogleは、Web上のあらゆるページを収集、格納し、検索ユーザーに対し、ユーザーの問いに適切な「解」を与えられるよう日々技術開発を続けている。そのGoogleはしかし同時に、本のデータも収集、今では数千冊規模の書籍データを保有している。Google Ngram Viewerはその本のデジタルデータを使って、任意の単語・フレーズの出現頻度を年ごとにプロットして表示してくれるサービス。
英語のほかフランス語、ドイツ語、スペイン語、ロシア語、簡体字中国語などに対応しているが、日本語は現状対象外。2010年12月から、正式サービスとして提供されている。
Google Ngram Viewer https://books.google.com/ngrams
もっと教えて!
2016年2月中旬には、Google Ngram Viewerを開発したふたりの科学者、エレツ・エイデン Erez Aiden、ジャン-バティスト・ミシェル Jean-Baptiste Michelによる著書が発売される。『ビッグデータで文化を計測する―デジタル人文科学の誕生』(仮)。
「歴史学や語学、文学などの人文科学の研究にも、ビッグデータの波が襲いかかろうとしている!その誕生の経緯と、どのように活用され、何がわかるようになったか、その意義を解説。彼らが「カルチャロミクス」と名づけた、文献をビッグデータとして利用するこの新しい研究を紹介する」。(【近刊予告】『ビッグデータで文化を計測する―デジタル人文科学の誕生』(仮) http://soshishablog.hatenablog.com/entry/2015/12/16/214013 )
1.例:国家を論じた政治哲学者の盛衰(書籍中に取り上げられた頻度の歴史的推移)
たとえば國分 功一郎氏の『近代政治哲学:自然・主権・行政』に登場する政治哲学者の名前を、Google Ngram Viewer に投じるとこのような結果が返ってくる。
第1章 近代政治哲学の原点―封建国家、ジャン・ボダン
第2章 近代政治哲学の夜明け―ホッブズ
第3章 近代政治哲学の先鋭化―スピノザ
第4章 近代政治哲学の建前―ジョン・ロック
第5章 近代政治哲学の完成―ジャン=ジャック・ルソー
第6章 近代政治哲学への批判―ヒューム
第7章 近代政治哲学と歴史―カント
・Bodin,Hobbes,Spinoza,Locke,Rousseau,Hume,Kant,
2.例:19世紀の電気自動車
次世代自動車として脚光を浴びている「電気自動車」だが、自動車の歴史からいうとリバイバルという側面が実はある。つまり、19世紀後期の段階で、蒸気自動車から当時の「次世代車」としてガソリン車とともに電気自動車も選択肢のひとつにあったのだが、そのことが下記の折れ線グラフからも読み取れる。
・electric car,motorcar,
3.使い方の詳細
イ.本へ辿りつける
上の電気自動の事例で、画面下に並ぶ年代をクリックすると該当の本が出てくる。たとえば、1899年~1914年の項目をクリックすると、いくつかの本が表示され、その中の『Electric Car Operation』をさらにクリックすると、その本の「Electric Car」という単語が登場する該当ページがスニペット表示される。
表示をさらに下にスクロールすると、この本の頻出語が一覧できる。
さらに書誌データもある。この本はJames H. Griffin, Harold C. Frickという二人の著者が書き、National Railway Training Association,から1913年に出版された本で、シカゴ大学図書館に所蔵されていたものを、GoogleBooksプロジェクトによりデジタル化され、このサービスで発見される(「このことはどこ(どの本)に書いてある?」)こととなったのだ。
ロ.アスタリスク * を使ってワイルドカード指定ができる
ワイルドカードとは、文字の代わりとして使うことができる記号のこと。「University of *」と記入すると、◯◯大学がずらりと並ぶといったことが可能になる。
ハ._INF をつけると活用形を考慮した検索が可能になる。
ニ.Ngram Compositions:いわゆるand, or検索や検索結果の(Y軸方向の)演算が可能。
ホ.期間設定
デフォルトでは1800年から2000年となっているが、前後に伸ばすことは一応可能。ただデフォルトでこの200年間にしているということは、その前後ではサンプル数が少ないというGoogleサイドの判断があるのかもしれない。
ヘ.言語設定
同じ単語を、ドイツ語で、フランス語で、といった具合に言語を特定して検索することもできる。ただし、日本語の選択肢はない。
この記事では、「戦争」を英語、フランス語、ドイツ語、イタリア語でそれぞれ検索してみた結果が表示されている。(西暦1500年頃から現在までのトレンドキーワードを調べることができるGoogleツール http://nelog.jp/google-ngram-viewer )
・英語
・フランス語
・ドイツ語
・イタリア語
◇関連URL
●Google Ngram Viewer https://books.google.com/ngrams
●Google books Ngram Viewer概観 http://masagrant55.hatenablog.com/entry/2013/12/22/021313
●西暦1500年頃から現在までのトレンドキーワードを調べることができるGoogleツール http://nelog.jp/google-ngram-viewer
●日本語のハンデと人工知能とGoogleBooks訴訟 | ちえのたね|詩想舎 http://society-zero.com/chienotane/archives/3534