無機結晶構造データベース「ICSD」がAPI機能を提供

MI研究用で注目、高速に一括ダウンロードが可能

 2020.06.30−独FIZ Karlsruhe(カールスルーエ)が提供している無機結晶構造データベース「ICSD」に、今年2月、API(アプリケーションプログラミングインターフェース)機能が追加され、マテリアルズ・インフォマティクス(MI)研究で注目を集めている。人工知能(AI)/機械学習を利用した材料研究のための良質なデータ源となるため。通常の契約ではひとつずつデータを取得する必要があったが、APIを使えばスクリプトを書くことで大量のデータを一度にダウンロードすることが可能。国内で取り扱う化学情報協会にも問い合わせが相次いでおり、まずは1ヵ月の無料トライアルでニーズに応えている。

 ICSDは、1913年以降に発表された金属や合金、金属間化合物、セラミックス、鉱物などの無機化合物と元素を1,600以上の雑誌から網羅的に収録したもの。近年、理論計算によって得られた構造や、無機材料と類似の性質を持つ一部の有機金属化合物の収録も開始された。収録内容は、化合物情報、結晶学データ、実験情報、三次元原子座標、書誌情報、抄録などで、現在の収録件数(2020年春版)は21万8,839件となっている。無料のデータベースと異なり、データの信頼性に定評があり、専門スタッフがチェックしていることと、データがおかしいときはコメント欄に記載するほか、著者への確認を行う場合もあるという。

 ICSDをMI研究に利用する方法としては、収録されている結晶構造や化合物データをもとに第一原理計算で目当ての物性値を計算し、それを入力として機械学習を実行、その物性を予測するAIを構築するという使い方がある。また、プロトタイプ構造(ICSD内のStructure typeやANX formula)にさまざまな元素を組み込んで仮想的な結晶をつくり、第一原理計算で構造最適化することにより、未知物質の構造や物性を推定することもできる。二次電池、蛍光体、触媒、半導体、超伝導体、磁性体など、実際に世界中の材料研究でICSDが活用されており、世界の無機化学領域のMI研究は、ほとんどがICSDに立脚していると言っても過言ではないということだ。

 さて、今回のAPI機能だが、簡単なスクリプトを書くことで大量データを一括して取得することが可能になる。これまでの契約では、データをレコード単位でひとつずつダウンロードしなければならず、CIFファイルの数にも上限があったが、API契約をオプションで追加すればそうした制限はなくなる。CIFファイルやLongviewファイルのほか、結晶構造中の結合長や角度をCSV形式で、Jmolによる結晶構造図をJPEG形式で、粉末解析パターン画像(JPEG)、x-yデータ(CSV)、書誌情報(TXT)も自在にダウンロードできる。

 現在、APIの1ヵ月無料トライアル、ICSDデータベース本体の2週間無料トライアルを受付中。正式利用は年間契約で、APIオプション自体は手ごろな料金であることも反響が大きい要因だという。すでに国内でも大学や企業からトライアル申し込みが相次いでおり、MI研究のために即決した企業もあるようだ。

******

<関連リンク>:

FIZカールスルーエ(ICSDホームページ)
https://icsd.products.fiz-karlsruhe.de/

化学情報協会(ICSD製品紹介ページ)
https://www.jaici.or.jp/wcas/wcas_icsd.htm


ニュースファイルのトップに戻る