Google Scholar その1

Google Scholar のベータ版が公開されて1年余りが経ちます。いまだ、ベーター版であるにもかかわらず、Google Scholarを利用している人の数はかなり増えているようで、最近、相次いでNew England Journal of MedicineとBritish Journal of Medicineに記事が掲載されました。High Wire Pressにホストされている844の学術雑誌にアクセスする検索エンジンの56.4%がGoogle、8.7%がPubMed、3.7%がGoogle Scholarとなっていて、Google Scholarも結構使われるようになっています(NEJM, 354:4-7, 2006)。また、BMJにアクセスした検索エンジンの1位はGoogle、2位はGoogle Scholarで、それぞれPubMedの10倍近い頻度であるとのことです(BMJ, 331:1487-1488, 2005 )。

このように、Google Scholarを使った検索はPubMedを使った検索と肩を並べるほどになってきました。とはいっても、これは研究機関に属さない一般の人の利用を含んだデータであり、医学生物学者が文献を調べるには、PubMedに圧倒的な優位がありますが、Google ScholarにはPubMedにはない機能もありますので、Google Scholarについてまとめておきたいと思います。

 

■Google Scholarとは

通常のGoogle検索では文献以外にもネット上のあらゆるドキュメントが検索対象になっていますので、学術情報以外の多くのノイズを拾ってしまいます。Google Scholarは検索対象を学術論文、学位論文、書籍、学術出版会社や学会、学術機関からの抄録や論文といった学術情報に絞ることで、インターネット上の学術情報に特化した検索エンジンとなっています。

 

■Google Scholarの機能

Google Scholarは非常にシンプルなインターフェースであり、Google同様、検索窓に検索語を打ち込んでボタンを押すだけです。検索結果は関連度が高い順にリストアップされると当時に各検索結果には次のようなリンクが提供されます。

  • 引用回数の表示と引用文献へのリンク「cited by」。
  • 著者名、論題からのキーワード抽出によるGoogle検索のためのリンク「Web Search」。
  • その他、出版社該当論文サイトへのリンク、PubMed抄録形式へのリンク、図書館へのリンク、など。

Google Scholar の機能を理解するために、医学生物学系の文献検索データベースとして最もポピュラーなPubMedと比較してみましょう。

まず、根本的な違いとして、PubMedは掲載されている文献データが米国立医学図書館(National Library of Medicine)によって作成されており、人の手によって体系的に構築されたデータになっていますが、Google Scholarはインターネット上に公開されているドキュメント情報をロボットによって網羅的に自動で集めたデータベース(というより検索エンジン)であるということがあります。そのため、Google Scholarの検索結果の制度や提供情報の質には自ずと限界があるといえます。

検索対象ですが、PubMedが医学生物学型の学術論文に限っているのに対し、Google Scholarは医学生物学系に限らず、自然科学系、社会科学系のすべての学術ドキュメント(学術論文のみならず抄録や書籍、プリプリントドキュメントなどかなり幅広い)が対象になっています。また、PubMedの場合、収載誌がhttp://www.nlm.nih.gov/bsd/serfile_addedinfo.htmlに明らかになっているのに対し、Google Scholarの場合、明らかにされていません。実際問題として、Google Scholarは学術情報とはいえない小説なども引っかけてしまい、厳密に学術情報のみに対象を絞り込めてはいないようです。ただし、そのような情報はランキングで下位になるために実際には問題にはなっていません。

PubMedでは検索結果はすべて抄録へのリンクとなっており、抄録のページにフルテキストへのリンクが提供されています。Google Scholarにおいては、フルテキストが提供されている場合には、検索結果が直接フルテキストへのリンクになっています。フルテキストの閲覧権を持たないユーザーがアクセスした場合には、自動的に無料のアブストラクトページや論文購入ページなどへ誘導されるようになっています。

PubMedでは検索結果は出版年の新しいものからソートされてリストアップされますが、Google Scholarでは関連度の高い順引用回数順にソートされてリストアップされます。古い論文の方が比較的上位にランクされるため、この点は使いにくいですね。出版年でソートできるよなオプションをつけた方がよいと思います。

また、PubMedに最近実装された、RSS配信、e-mailアラートサービスなどの付加サービスは、Google Scholarには実装されていません。

以上のように、医学生物系の学術論文情報だけに絞るのであれば、PubMedの優位性は崩れませんが、ひとつだけGoogle ScholarにあってPubMedにはない機能があります。それが、文献の引用関係です。Google Scholarの検索結果にリストアップされる各文献データには、「Cited by」というリンクがついており、その文献が他のどの文献で引用されているか、また、他の論文に引用された回数が表示されます。この「Cited by」の機能がGoogle Scholarの大きな特徴です。この点について次項で詳しく見てみましょう。

続きは明日。

アーカイブ

過去ログ一覧