MKIらが深層学習によるタンパク質構造決定の新ツール
産学協同で「QAEmap」開発、データ分解能に依存せず構造を評価
2021.12.21−三井情報(MKI)は20日、田辺三菱製薬、横浜市立大学、理化学研究所、京都大学とともに、機械学習を用いた新規のタンパク質結晶構造評価法「QAEmap」(Quality Assessment based on Electron density map)を確立したと発表した。タンパク質の結晶構造をアミノ酸単位で機械学習したもので、もとのデータ分解能に依存せず、ループ領域の構造評価にも適用できることが特徴。薬剤候補化合物と標的タンパク質との結合様式を調べる創薬研究や分子シミュレーション研究に役立つと期待される。
今回の研究は、昨年3月まで実施されたライフインテリジェンスコンソーシアム(LINC、現在は一般社団法人)の成果として開発、実用化されたもの。タンパク質の立体構造は、X線結晶構造解析あるいはクライオ電子顕微鏡解析によって決定できるが、データ分解能が低いと正確な構造決定が難しくなる。今回の研究では、公共データベースに登録されている高分解能の構造データ/電子密度データ(約9,500セット)を、3D-CNN(3D畳み込みニューラルネットワーク)で深層学習させた。
とくに、bCC(ボックス相関係数)と呼ぶ新しい指標を導入しており、このボックスを用いた目的変数を機械学習で算出している。これにより、ボックス内でアミノ酸を周囲の環境とともに学習させることが可能となった。極性相互作用や疎水性相互作用など、共有結合していない近隣の原子との相互作用を考慮することによって、タンパク質の局所構造の評価にも利用でき、とくに低分解能では難しいループ領域の構造決定にも適用できることを確認したという。
今後、予測されたbCCに基づいて座標を改善する研究を進めるとともに、水の影響を考慮するなどbCCの改良も図る。また、今回はX線データを使用しているが、より分解能が低いクライオ電子顕微鏡への適用も検討していくとしている。QAEmapは、実験研究者による構造決定を支援する評価ツールとして開発されており、将来的にタンパク質構造ベースの創薬研究に幅広く寄与すると期待される。
なお、今回の論文は「Scientific Reports」誌に「Machine learning to estimate the local quality of protein crystal structures」のタイトルで掲載された。
******
<関連リンク>:
三井情報(トップページ)
https://www.mki.co.jp/
三井情報(バイオインフォマティクスのページ)
https://www.mki.co.jp/solution/bioinfo.html
掲載された論文へのリンク
https://www.nature.com/articles/s41598-021-02948-y