CCS特集:アドバンスドテクノロジーインスティテュート

バイオとAIを融合、知的ゲノムデータベース開発へ

 2003.06.26−アドバンスドテクノロジーインスティテュート(ATI)は、バイオとAI(人工知能)技術とを融合した新たなシステム開発に乗り出す。知識ベースの自動生成機能を備えた知的ゲノムデータベース(DB)システムを製品化し、1セット500万円程度で売り出す計画を立てている。

 このシステムは、帰納論理プログラミング(ILP)と呼ばれる方法を応用したもの。これは機械学習で注目されている手法で、DBから知識のもとになるルールを自動的に抽出することができる。専門理論などの背景知識をルールの抽出に利用でき、その抽出したルールを背景知識に統合して再利用できるという特徴がある。

 同社は、九州工業大学の皿井明倫教授らが作成した生体分子統合DBの3DinSight、たん白質熱力学DBのProTherm、たん白質・核酸認識DBなどを利用し、そこからルールや知識を抽出して知識ベースを構築。さらに、その知識ベース上での帰納型推論エンジンを開発して、最終的な製品化へと結びつけていく。

 国際的なゲノムプロジェクトによって多数のデータが蓄積されたが、その中から生物的に意味のある知識を引き出すことがこれからの最大の課題だといわれている。今回のシステムは、膨大な生データを整理・統合し、その中に埋もれた知識を抽出するための方法論を確立するという面からも広く注目を集めそう。

 アプリケーションとしては、たん白質の三次構造予測への適用が期待されるという。この場合は、DBからたん白質のフォールディングパターン(ルール)を抽出し、システムに学習させることで、例えば二次構造の要所の情報を与えることでフォールディングタイプを答えさせるシステムが可能になる。