材料研究分野で挑戦、“ゆりかごから墓場まで”データフル活用の効果

あらゆる研究領域のモデルに

 材料研究分野でデータを“ゆりかごから墓場まで”フル活用するシステムの構築が進んでいる。人工知能(AI)技術やデータ科学を有効に使うには計測機器や学術論文など、研究開発環境を再構築する必要があった。材料業界では学術界と産業界が連携しながらデータ活用を模索する。この挑戦はあらゆる研究領域のモデルになる。

AI・データ科学導入


 材料開発にAIやデータ科学を導入するマテリアルズ・インフォマティクス(MI)が急拡大している。材料データを蓄積して解析し有望な材料組成を絞り込んだり、製造条件を最適化したりする試みが成功したためだ。そして数学は時に抜本的なブレークスルーを起こす。東北大学の富安啓輔助教と山形大学の富安亮子准教授らは、中性子線回折散乱データから、物質の磁気構造や原子占有率を求める数理手法を開発した。

 物質の磁気構造は磁性材料の設計、原子占有率は固体電解質のイオン伝導性などを理解する重要指標だ。これが数学の方程式を解くように正しい答えが求まる。富安助教は「これまでのデータを計算し直せば、研究者ごとに違った学説に答えを出せる」と強調する。従来は最も確からしい候補を選んできたが、正解であると保証できなかった。数学的に答えを保証できるインパクトは大きい。

 データが保管されていれば再点検は可能だ。ただ現状では多くの実験データが死蔵されている。科学論文に掲載されるデータは研究室から生み出されるデータのごく一部だ。その論文でさえ発行されると役割を終えるものが多く、他の研究者に読まれて再検証される論文は少ない。そこで物質・材料研究機構は計測機からデータを直接収集するシステムと、半ば死蔵された論文からデータを再取得する技術を開発する。ゆりかごから墓場までデータを再活用する。

    

 計測機からのデータ収集ではメーカーの協力を得て、装置の内部データ(バイナリデータ)の書式を集めた。この書式は計測機の種類や型番によって変わる。電圧変化や吸光スペクトルなどの計測条件や計測値が、どのように格納されているか装置によってマチマチだった。物材機構は2社から書式情報をもらい、内部データをAIなどが読めるように直す自動翻訳ツールを整備中だ。

“寿命”伸ばす管理必要


 計測機メーカーにとっては、データは自社の分析ソフトで解析してもらいたいところだ。装置と分析ソフトの両面からユーザーの囲い込みが進んでいる。ただ物材機構の橋本和仁理事長は「化学会社などの計測機ユーザーからはもっと強力に進めてくれと、お尻をたたかれている」と苦笑いする。物材機構材料データ解析グループの吉川英樹リーダーは「協力する装置メーカーは囲い込みは不可能と考えている。データを一人歩きさせ、その先のソリューションをいち早く取り込む戦略を描く」と説明する。

 そのために重要なのがデータの寿命だ。現状は、装置の型番が廃止されたら内部データは読めなくなる。翻訳ツールを使って蓄積すれば再活用できる。吉川リーダーは「検索やライセンスを整え、AIのような新技術にも対応するなど、寿命を伸ばすデータ管理が必要」と強調する。

 論文に載った実験データの再活用も重要だ。物材機構材料データベースグループの石井真史リーダーらは自然言語処理技術で過去の膨大な論文から物性値を集めている。高分子材料では6万報の文献から100種の物性値を収集した。

 石井リーダーは「物材機構の専門家が論文を読み集めてきたデータの12年分を、AIは1―2週間で集めてくる」という。精度は9割以上で、ビッグデータ(大量データ)解析には十分な質と量だ。この文献データを元に計測機のデータを解析する技術を開発中だ。材料構造の推定など、研究者がデータを解釈しやすくなる。

 物材機構はこうしたデータ収集や処理、解析、蓄積、管理、公開の機能をまとめた統合データプラットフォームを構築中だ。2020年に機構内部で運用開始、21年には機構外で利用開始を目指す。データシステムグループの門平卓也リーダーは「課題はデータシェアが研究者や企業に受け入れられるかどうか」と指摘する。

 物材機構の長野裕子理事は「企業の経営層からは『グループ会社であってもデータ共有はしたくない。だがデータは連携させ、より広範にダイナミックに解析したい』という矛盾した要望を受ける」と明かす。競争に任せると連携が進まないため、旗振り役としての期待が集まる。

NEC・日立など電機各社に商機


 電機各社にとってデータ共有は商機だ。NECはデータを秘匿したまま複数のデータを処理する秘密計算を提案する。お互いにデータの内容はわからないが、データ処理の結果は共有できる。従来は計算コストが高かったが、NECの西原基夫執行役員は「新しい数理手法を見つけて計算時間が1000分の1から1万分の1になった。世界でダントツの技術」と胸を張る。

 データ処理プログラムを秘密計算仕様に自動修正するツールも開発した。データ処理用に数十行のコードを書くと数万行の秘密計算用コードが生成される。普通の情報技術者がいれば、秘密計算ができるようになる。

 NECの竹之内隆夫主任研究員は「自分と同じ実験データをもつ相手がないか秘密検索するユーザーが増えている。同じ研究をしているとわかれば内々に交渉して契約を結び共同研究を始める。アナログな使い方から広がっている」と説明する。

 日立製作所は受託解析サービスを展開する。顧客から実験データを預かり、データサイエンティストが解析する。相関のある因子の組み合わせや特異例などを特定し報告する。最小で材料開発期間が5分の1になった。

 データを預かる際に融点や電気伝導性などのデータの意味を消してから預かる念の入れようだ。データの意味が分かれば、例えば融点と沸点は相関があるなど、材料の知識を使って無駄な解析を省ける。分析の確度を上げられるはずだが、日立の浅原彰規主任研究員は「現在は顧客からの信頼を何よりも優先させている」という。技術開発とビジネスモデルの両面からデータ共有の壁を突破しようと取り組みが進んでいる。

    

(文=小寺貴之)

日刊工業新聞2018年1月7日

COMMENT

小寺貴之
編集局中小企業部
記者

大学の研究者はそれぞれニッチで先端的な研究をしているため、他の分野の研究者とデータを共有するメリットを感じにくいです。小さな最先端を集めてもデータの規模の相乗効果は少ないように思います。大企業は幅広くデータを持っているため社内のデータを整理して資源化するだけで効果があります。ただその効果は社外には開示されません。物材機構は自身で成功例もデータの連携モデルも提示しないといけません。海外で華々しく成功例が示され、連携モデルを強要されるようになってからでは手遅れになります。IT業界はそうなりましたが、その応用の材料業界は日本がリードする力があります。オールジャパンではまとまれなくても、計測機業界のように、何社かと物材機構が組んで、成功例と連携モデルを作り、それで国内外の材料ユーザーを巻き込んでいくのが良いと思います。

関連する記事はこちら

特集