創造的な仕事に活用も…大量データ学習の基盤モデルに期待が集まる理由
大量のデータを学ばせた基盤モデルに期待が集まっている。煩雑なデータ整理の自動化のような地味な仕事以上に、研究仮説の生成や発見支援、複雑科学のモデル化などの創造的な仕事への活用が期待されている。材料分野では物質の構造や物性などを学んだ基盤モデルが開発される。モデルから知見や法則を引き出す研究手法になると期待される。
「2024年中には提供を始めたい」―。IBMリサーチの武田征士チームリーダーは材料科学向けの基盤モデル「ライゾーム」を開発している。化合物の分子構造をSELFIESという方式で文字列に変換し、分光スペクトル(波形データ)や物性をセットで学習させて対応を学ばせた。すると分子構造からスペクトルと物性を予測したり、反対に欲しい物性から分子構造やスペクトルを予測したりできるようになった。高分子物性や発光特性、生物活性も予測でき、他の人工知能(AI)モデルよりも優れていた。国際団体「AIアライアンス」を通じ提供する。
ライゾームは一つのモデルで物性予測や分子設計などの複数の用途に適用できるため基盤モデルといえる。従来は科学シミュレーションをAIで高速化するサロゲート(代理)モデルが中心だった。これはコストの大きいシミュレーションを先に計算しておくデータベースサービスに似ている。データベースと違うのはAIがデータとデータの間の実際に計算していない条件も推定してくれる点だ。サロゲートモデルの中にシミュレーションで扱う物理法則が学習を通して形成される。
基盤モデルには複数の法則が内包される。分子構造と物性、結晶組織と材料特性、使用条件と劣化・耐久性などと学習要素を広げていけば、複数の法則が混ざった複合問題も扱えると期待される。
オムロンサイニックエックス(東京都文京区)の谷合竜典シニアリサーチャーはトランスフォーマーに無機材料の結晶構造を教える手法を開発した。トランスフォーマーは画像認識や大規模言語モデル(LLM)で成功したAIモデルだ。アテンション機構という仕組みを元に、AIの処理を解釈するための手法が開発されてきた。材料研究者がAIの予測を解釈しやすい。
谷合シニアリサーチャーは「AIで新たな法則を見いだせたら面白い」と期待する。材料分野は生命科学に比べて分かっている法則が多い。AIの見いだした法則が既知の法則の組み合わせで表現できなければ、そこには飛躍の可能性がある。