化学情報協会:千原秀昭会長インタビュー
欧米との情報格差を解消するSTNサービス、網羅性と検索機能でリード
2008.07.03−化学情報協会(JAICI)は、ワールドワイドな化学技術情報の流通を促進する目的で1971年に設立された。米国をはじめとする各国の情報機関との協力体制を築きながら、優れた情報源を国内の研究者に提供し、欧米との情報格差を解消するという意味で大きな役割を果たしてきている。とくに中心になるのはCAS(ケミカルアブストラクツサービス)データベース(DB)に関する事業で、CASのオンラインサービスである「STN」については、同協会が東京サービスセンターを単独で運用している。DBサービスはいまや研究開発に欠かせないインフラだが、千原秀昭会長(大阪大学名誉教授)に過去の経緯やSTNの特徴・利点などについて話を聞いた。
◇ ◇ ◇
− DBサービスが普及しはじめたのは1980年代からとのことです。意外に新しいものですね。
「協会が設立されたころは、日本と欧米との情報格差がすごかった。外国でどういう研究が行われているかを知ることが、まず難しかった。そうなると、研究のスタート時点で大きなハンデを負ってしまう。研究がそれなりに進んでから、外国に先行者がいたことがわかったなどというケースも、当時は珍しくなかった」
「そうしたなかで、オンラインDBサービスが登場し、1980年代に一気に盛んになった。CASがその草分けになるが、いろいろなところから簡便なシステムが市販されるようになり、便利な統合サービスもあらわれてきた。現在はDBサービスの需要はほぼ一巡しており、STNにしても日本の化学工業に属する企業や大学・研究機関はほとんどが導入済みだ。新しい研究プロジェクトをはじめる場合、まずは文献を調べることが最初のステップ。その意味では、DBサービスはすっかり研究のインフラになったと思う」
− 最近の市場でのSTNの位置づけはどうなのですか。
「競合するサービスは多い。それら後発品は低価格で販売力もあるので、けっこう使われているし、それで間に合う場合もある。ただ、ほしい文献が出てこないときもあるが、そうした際にはSTNを使って検索してみるようだ。サーチャー(検索の専門家)たちはSTNを最後の頼みにしている。それならば、最初からSTNを使ってくれよと思うけれどね・・・」(笑い)
− STNの違いは何なのでしょう?
「DBにとって最も重要なことは網羅性。ある事柄を検索してもわからない場合、それがDBの中に入っていないからなのか、世の中に存在していないからなのかどうか、判断できなくなるからだ。だから、網羅性が十分に高いDBを使用しなければならない。それに加えて、検索システムもきわめて重要だ。検索で出てこなければ、DBに入っていないのと同じことになる。DBが良くても検索がだめなシステムは使い物にならない」
− なるほど。網羅性と検索精度ですか。STNはそれが両立しているということですね。
「それが、口で言うほど簡単ではない。STNの中心である文献DB“CAplus”は広い意味の化学をカバーしており、天体物理学から薬理学まで物質が関係するあらゆる学問分野を網羅している。そのソースは学術雑誌、商業誌、特許、実用新案と幅広く、100年を超える歴史を累積して現時点で約2,600万件の情報が登録されている。そして、毎年150万件が追加されていく」
− それがCASの誇る網羅性というわけですね。
「ところが、逆にここまで網羅してしまうと、情報量が膨大であるために、キーワードを1つ入れると何万件ものヒットが出てくるという問題が生じる。1つの研究に必要な文献はせいぜい100だといわれるので、重要なものだけを選び出さなければならない。そのためには、検索プログラムの出来はもちろん、とくに索引が完ぺきである必要がある。STNには“ピンポイント検索”という機能があるが、索引を工夫しているために重要な文献をうまく絞り込むことができる。ここが、DB作成で一番手間のかかるところだ。索引は時代とともに見直す必要があるし、それをさかのぼって適用していかなければならない。網羅性が高いだけに、この作業はたいへんな労力を要する」
− よくわかりました。ところで、最近は特許DBも注目されているようですが・・・。
「特許は、技術面に加えて法律的な面を含むため、学術文献とは扱い方が変わってくる。ただ、特許DBもやはり網羅性がカギで、CAplusでは世界の51ヵ国と3つの国際機関の特許情報を収録している。とくに最近は中国から特許がたくさん出てきているが、そうした各国語の特許を読んで分析し、適切な索引を付けていかなければならない。このあたりの努力は、CASが一番きちんとやっていると思う」
「企業の知財部門は、大切な情報を逃したらどれほどの損害になるかをよく理解している。それで、情報取得には費用を惜しまない。しかし、公知の事実は特許には入ってこないので、特許情報だけに注目しても不十分であり、その点でも文献情報と特許情報の両方を網羅したCAplusには大きな優位性がある。また、STNであればトムソン・ロイターの“ダウエントワールドパテントインデックス”(DWPI)も利用できるので、さらに万全になる」
− STNには便利なツールもあるようですね。
「STN AnaVistを使えば、検索結果を統計分析してわかりやすく可視化することができる。物質と文献と特許を網羅しているため、興味深い結果を示すことが可能だ。例えば、ライバル企業が出願した特許を分析して、自社の研究戦略の立案に役立てたり、特定の分野の特許の世界的な傾向をパテントマップにして、狙い目の研究分野を絞り込んだりするなどの用途に応用できる。これなどは、研究者だけでなく、企業のマネジメント層にも利用してもらいたい機能だ」
− 最初の話に戻りますが、日本と欧米との情報格差は解消されたのでしょうか。
「STNのようなDBサービスの普及で、情報の時間差・地域差はなくなった。しかし、残念ながら、いまだ格差は残っている。情報源は同じでも、使う側に差がある。そこで、使いこなしのレベルを上げ、検索のテクニックを磨いてもらうための講習会に力を入れている。東京と大阪だけで年間200回以上開催している。また、ヘルプデスクも充実させている。検索の最中に操作がわからなくなって電話してくる人もいるので、手元に利用者と同じ画面を出してガイドできるようにしている。当協会のヘルプデスクは、わりと評判が良いようだ」(笑い)