ベイジアン・アプローチに基づく情報統合型物質・材料探索

ベイジアン・アプローチに基づく情報統合型物質・材料探索
情報・システム研究機構 統計数理研究所
モデリング研究系・データ同化研究開発センター
吉田 亮
一般に、物質・材料探索のパラメータ空間は超高次元である。例えば、有機化合物のケミカルス
ペースには、1060 個の分子が存在すると言われている。このような広大な探索空間から所望の物
性及び機能を併せ持つ埋蔵物質を発掘する作業(多目的最適化)が物質・材料探索である。物
質探索から製造プロセスに要する時間とコストを大幅に削減する。マテリアルズ・インフ
ォマティクスにおける一つの問いは、このグランドチャレンジの実現に向けてデータ科学
の発想と技術をいかに活用していくかである。本講演では、ベイジアン・アプローチに基
づく物質・材料探索という切り口からデータ科学のいくつかの可能性を示したい。解析手
法のアウトラインは、以下の通りである:(i)実験や理論計算(第一原理計算など)から得ら
れた構造・物性データを用いて、機械学習で構造から性質のフォーワードモデル(構造物
性相関モデル:quantitative structure-property relationship(QSPR))を構築し、(ii)ベイズ則に
従ってこれを反転させ、性質から構造のバックワード予測(Inverse-QSPR)を導く。(iii)モ
ンテカルロ計算でバックワード予測の確率分布から物質の構造を発生させ、所望物性を有
する埋蔵物質を発掘する。MI2I における我々のミッションは、方法論の適用対象を、薬剤
分子、樹脂、色素、ポリマー、格子欠陥、ナノ構造材料へと展開していくことである。本講演
では、有機分子設計への適用事例を中心に、物質・材料研究におけるベイジアン・アプロ
ーチのエッセンスについて解説する。