2007年05月28日

「見えなかった情報」を可視化――NII、論文300万件をGoogle検索対象に

「見えなかった情報」を可視化――NII、論文300万件をGoogle検索対象に
【ITmediaニュースより以下転載】
国内論文約300万件が、Googleから検索できるようになった。Web検索だけで情報収集を完結してしまう人にとって検索にひっかからない情報は存在しなかったも同然。検索対象に加えることで、論文をWeb上でも“可視化”する。

 国立情報学研究所(NII)が4月から、国内の学術論文情報300万件のデータベース「CiNii」(サイニイ)をGoogle検索対象にした。同時に、データベースも検索エンジンが見つけやすい形に変更。一般ユーザーが論文情報にアクセスしやすくした(関連記事参照)。

 論文検索エンジン「Google Scholar」のコンテンツを整備・充実させたいGoogleの思惑と、論文情報へのアクセスを増やしたいNIIの思惑が一致して実現した。「Googleにすべてを持っていかれるのでは」――CiNiiに論文を提供している学会の一部にはこう心配する声もあったというが、NIIが説得を重ね、構想から約1年後に公開にこぎつけた。

 「『今すぐ無料で情報が欲しい』というWebを中心にした生活スタイルと、書籍や論文という“知識の体系”とのすき間を埋めてきたい」と、NII助教の大向一輝氏は狙いを語る。

「なかったこと」になっていた情報を可視化
 何かを調べる際、Web上だけで情報収集を済ませてしまう人は今や少なくない。そういう人にとっては、論文にちょうどいい情報があったとしても、Web検索に引っかからない限りその情報は「なかったこと」になってしまう。


CiNiiのトップページ NIIは、論文を検索しようと考えもしなかった人に、まずは論文の存在を知ってもらいたい、と公開に踏み切った。「普通の人がものを探す中で、いきなりCiNIIに来ることはないだろうが、Google検索でこのページにたどりつくことはあるだろう」と、NIIコンテンツチーム係長の阿蘇品(あそしな)治夫さんは語る。

 CiNiiに収録されているのは、全国271の学会・協会から提供を受けた論文と、大学の研究紀要に収録された論文計約300万件。加えて一部雑誌の情報も検索できる。ある論文が別の論文からどれぐらい引用されたかを参照できる「被引用数」データも収録している。

 今回、GoogleとGoogle Scholarで検索できるようになったのは、従来のCiNiiでも無料で検索できた著者名や論文名、被引用数データなど、論文の冒頭に付けている概要紹介(アブストラクト)だ。“Googleフレンドリー”にするため、HTMLやURLをGoogleが検索しやすいよう書き換えたり、パーマネントリンクのURLをページ上に掲載したりするするなどといった地道な作業も行った。

 論文本文PDFの閲覧は従来通り、一部を除いて有料だ。「論文データベースを作るのは手作業で、膨大な手間ひまがかかっている。論文の形式や料金体系も学会によってさまざま。一括して無料にはできない」と大向氏は事情を説明する。

 学会によってWebへの態度も異なる。「Googleにすべてを持っていかれるのでは」と心配する学会もあり、全学会でOKを取り付けるまでは苦労もあった。ただ最終的には「一般の人に論文の存在を伝え、学会を知ってもらえるのはメリットになる」という意識が広まり、全学会から理解を得ることができたという。

 公開した効果はすでに現れ始めた。Google経由で閲覧されたCiNiiのページビューは、5月初めに10万を超え、直接CiNiiを訪れたユーザーの総PVを超えた。「今後もGoogle経由のアクセスが増えていくだろう」(阿蘇品さん)

Googleのロボット×手作業=知識へのアクセス
 NIIは、その前身である「学術情報センター」時代から、国内の情報をまとめて発信するという役割を担ってきた。図書館の蔵書情報検索サービス「Webcat」「Webcat Plus」や、学術情報データベース「NII DBR」などを展開。書籍や論文の情報へのアクセス経路を整備してきた。


阿蘇品さん(左)と大向さん 2005年にスタートしたCiNiiも、そんな取り組みの1つだ。CiNiiのデータは、マシンで情報を収集・整理するGoogleとは対照的。学者が手で書き、査読し、学会で精読し、学会誌に掲載した論文に、被引用数を手作業で確認して作っており、何人もの人が膨大な手間ひまをかけている。

 人の手で整理した情報にはロボット検索にはない価値がある。「キーワード検索では、周辺の分野や、他の情報との関連性が見えづらい。手作業で整理した論文情報のページには、著者や掲載誌、引用情報などが書かれているから、ここを起点にして周辺情報に触れることができる」(大向氏)。各論文情報ページにはパーマネントリンクが付いており、それぞれのページが情報ポータルになる。

 大向氏は、私見と断った上でこう語る。「例えば、検索結果にAmazonの本を見つけて実際に購入したり、検索で評判のいい店を見つけて行ってみたりと、Web検索が徐々に、Webの中だけで完結しなくなってきている」。Webの中で存在を知り、実際に手に入れるために足を動かすという動きは、今後も進んでいくとの見方だ。

 「ロボット検索はすばらしいが、コンテンツを作っているのは個々の人。ものを作っている人が報われるようにしたい」(大向氏)。NIIは今後も情報公開を進め、Google以外のネット企業との連携にも積極的に取り組んでいきたいという。
やっと日本でも、学界で発表された論文の検索がgoogleできるようになるんですね。あまりにも遅くて、頭の固い閉鎖的な性格がよく出ていますが、何はともあれ嬉しい限りですね。

勿論、人手や手間がかかっているので正当な対価が必要というのは、分かりますが、悪意のある引用・剽窃等でない限り、可能な限り、無料でオープンにしてこそ、意味があると思うですが・・・?

海外では無料で閲覧できるのも数多いですよ! みんながみんな、閉鎖的であるとは言いませんが、私が知っている範囲では小さな既得権益にしがみつくような閉鎖性を未だに持っている人、いるからなあ~。もっともこれはアカデミックな世界だけではなく、ビジネスの世界でも山ほどいますけどね。

批判さえもできないように、材料となる情報一切を秘匿し、公開しない輩って官僚だけではありません。私個人は大嫌いですが、そういうの。実際に仕事だったら、やらざるを得なかったり・・・人間ってホントただ自分の意思だけで自由に生きるのって難しいですね。う~む。

まあ、何はともあれ、日本でもやっと一歩進んだってことでヨシとすべきでしょうね。実際に、私もネットで知りたいことを検索しているとこの「CiNii」というサイトによく辿りつくので知ってはいましたが、こういう事情があったとは初めて知りました。

今後は、論文自体も無料で公開して欲しいなあ~。いちいち国会図書館まで行って調べるなんて面倒なことしたくないもんね! 期待してます。

関連ブログ
Google Book Search、「デジタル化まだ」の本も検索可能に
米Google,著作権を問われない書籍を「Google Print」で全文検索・閲覧可能に
Googleで過去200年間のニュース検索が可能に
「文献調査法」毛利 和弘 日本図書館協会
大英図書館、アマゾンの書籍リストに希少本を掲載
大英図書館、シェークスピア作品の原本画像をネットで公開


posted by alice-room at 00:36| 埼玉 ☀| Comment(0) | TrackBack(0) | 【ニュース記事A】 | 更新情報をチェックする
この記事へのコメント
コメントを書く
コチラをクリックしてください

この記事へのトラックバック
×

この広告は180日以上新しい記事の投稿がないブログに表示されております。