FSIS研究グループがたん白質全電子計算の世界記録達成
306残基のインスリン六量体を解析、12月に統合システムのベータ版提供
2004.10.07−文部科学省ITプログラム「戦略的基盤ソフトウエアの開発」(FSIS)プロジェクトの次世代量子化学計算グループ(グループリーダー・佐藤文俊東京大学特任助教授)は、たん白質全体の電子構造を量子化学的に計算できる「ProteinDF」を利用して、たん白質全電子計算の世界記録を達成した。インスリン六量体を丸ごと解析したもので、もともとの開発者である九州工業大学の柏木浩名誉教授らのグループが2000年に実施したチトクロームCでの記録を塗り替えた。アミノ酸残基数で約3倍のサイズでの更新であり、12月には独特の計算手法を自動化するエディター機能を含む統合型システムのベータ版を提供開始することから、来年度に向けて産業界での普及も期待される。
ProteinDFは、密度汎関数法(DFT)をたん白質に適用したプログラムで、擬カノニカル局在化軌道(QCLO)を用いた独特な計算方法を採用している。まず最初に、たん白質のアミノ酸配列に基づいて1残基ずつの電子密度を求める。ステップ2で3残基ずつ(2残基を重ねて配列全体を網羅)のペプチド単位でのSCF(自己無撞着場法)計算を行い、3残基ペプチドのQCLOを求める。ステップ3以降は、これをベースにペプチド鎖を大きくしながらQCLO計算を繰り返し、最終的にたん白質全体の電子構造を評価するという手順になる。計算ステップ数は4−5が一般的なようだ。
2000年にチトクロームCを計算した時にはまだQCLOを取り入れていなかったため膨大な試行錯誤が必要になり、結果を出すまでに1年半(計算だけで2ヵ月間)がかかったというが、今回のインスリン六量体の計算例ではQCLOと自動計算機能の導入により23日間で終了した。
12月にリリースする「ProteinEditorベータ版」は、このQCLO計算シナリオを自動生成または視覚的に編集する機能を持ち、計算の実行支援や収束過程の情報を表示する機能も備えている。たん白質のモデル表示や計算結果の可視化機能も搭載し、統合システム化への第一歩になるという。とくに、シナリオエディターは全電子計算の計算ステップを一覧表示し、各ステップごとに計算するフレーム(計算対象とするアミノ酸残基の固まり)を対話的に設定していくことができる。フレームを伸ばしたり、フレーム同士を結合・分離させたりすることも自由。フレームをまたいだ高い相互作用を示す部位を表示したり、計算困難な部位を表示したりする機能もあるので、たん白質全電子計算実行の敷居はぐっと下がることになるだろう。
また、ProteinDFと連携できる分子動力学法プログラム「ProteinMD」が用意されていることも特徴である。この組み合わせで第一原理分子動力学計算を簡単に行うことが可能。具体的には、たん白質の初期座標をまずProteinMDに読み込み、座標データと計算パラメーターをProteinDFに転送、ProteinDFで量子計算を実行してエネルギーと力場をProteinMDに返し、その力場に基づいて再度座標データをアップデートする。これを収束するまで繰り返すことで、最終的な構造最適化が行える。
さて、今回のインスリン六量体の計算では、ステップ1でのフレームが1残基、ステップ2で3残基、ステップ3で8−9残基、ステップ4でインスリン単量体に相当する51残基、ステップ5で六量体全体の306残基−という計算シナリオを採用した。ただし、系が大きすぎて行列計算がコンピューターのメモリーに入り切れないため、行列を分散化できるようにプログラム自体を改造した。計算環境は、アイテニアム2(1.3GHz)が32個のクラスターで、メモリーは128GB、ディスクは760GB。最終計算が全体で約23日、並列化効率は70%だったという。
インスリン六量体のサイズは、306残基、4,716原子、2万6,766軌道で、これまでの記録だったチトクロームCの104残基、1,738原子、9,600軌道に比べて、一気に3倍近い系を達成したことになる。