日本学術界の命題「研究開発DX」、小さな国立研究開発法人が先鞭
23年度からデータマネジメント必須
研究開発のデジタル変革(DX)が日本の学術界の命題になっている。2023年度から公的資金による研究には、すべてデータマネジメントプランの策定が必要になる。研究データを研究室間で共有するなど、データの再利用が求められるためだ。ただ、研究者にとってデータは虎の子で、手の内を明かすメリットは見えにくい。物質・材料研究機構は早くからデータ共有に取り組み、成果を上げてきた。小さな国立研究開発法人(国研)が生み出したデータ整備の手法は、研究開発の新たなエコシステム(生態系)として期待される。(小寺貴之)
大御所、一笑に付すもJST事業で若手活躍
「成膜装置が壊れるまで実験し続けたら、きれいな膜ができた。材料研究は泥臭い実験の繰り返し。人工知能(AI)など役に立つはずがない」―。2014年、文部科学省の長野裕子ナノテクノロジー・物質・材料担当参事官(現審議官)は材料研究の大御所にマテリアルズ・インフォマティクス(MI)のプロジェクトへの協力を打診し、袖にされていた。元素戦略プロジェクト成果発表会の打ち上げの一幕だ。当時は名古屋大学の天野浩教授らがノーベル物理学賞を受賞し、会場は材料分野に大型予算がつくと沸いていた。
MIはデータ科学やAI技術を材料開発に導入する試みだ。原子レベルの物理現象を調べる「第一原理計算」などシミュレーションの研究者が手を挙げ、計算データの大規模データベース構築を検討していた。ただ、材料分野では、材料を作って実証する実験系の研究者の発言力が大きい。シミュレーションは研究ツールの一つに留まり、“実験第一主義”の材料分野でデータ科学に手をつけた研究者はほぼいなかった。
データ科学“使いこなす”
そんな中、物材機構は15年、科学技術振興機構(JST)の「イノベーションハブ構築支援事業」に採択され、データ科学と材料工学のハブ拠点としての役割を担うことになった。当初はデータ科学の研究者を招いたり、民間企業のデータサイエンティストと成果や手法を交換したりして知見の蓄積に注力した。
ただ、データ科学は一朝一夕に使いこなせるものではない。触媒会社の技術者も「会社の中で生き残るために必死にやっているだけ。データ科学は万能ではない。うまく使わないと結果は出ない」とこぼすほどだった。
物材機構の研究者も半信半疑のスタートだったが、ほどなく結果が出る。15年に始まったJSTの戦略的創造研究推進事業「さきがけ」で若手が成果を上げた。これを皮切りに、ベイズ最適化やクリギングなどデータ探索法を実験条件の絞り込みに用いた論文を続々と発表。長野審議官は「拠点事業と研究事業を並走させたことがよかった」と振り返る。
懐疑論、吹き飛ばす 連携で相乗効果
若手の活躍に実験系の大御所たちも重い腰を上げた。材料分野にデータ科学を応用し、新手法として論文を作成し、さらに見つけた新材料を論文にするなど、若手とベテランの連携で成果はさらに積み上がっていった。
ここにAIブームが重なった。産業界がデータやAIの人材を大量に採用し大学では人材不足が起こる。長野審議官は「17年に化学会社で次々にMIの部門が立ち上がり、数百人単位での人材育成が始まった」と振り返る。産業界に必要とされたことで、学術界でもデータ駆動の研究手法が重要だと認められていった。
長野審議官は当時、物材機構の理事として機構内の切り盛りをしていた。物材機構の19年度の運営費交付金は139億円。宇宙航空研究開発機構(JAXA)の1352億円、日本原子力研究開発機構の1324億円と比べるとはるかに小さい。小さな国研では研究も事務もすべてみる必要があった。
この間、ハブ拠点としての機能強化に向け、物材機構内ではデータの共有や活用について侃々諤々(かんかんがくがく)の議論をしていた。同じ材料研究でも分野をまたぐとデータを束ねるメリットが出にくい。反対に同じ分野の研究室には虎の子のデータは渡せない。データは集めてみないと解析するメリットがあるか分からないジレンマがあった。
「司令塔」が不可欠
統合型材料開発・情報基盤部門の出村雅彦部門長は「連携するにはどんなデータが必要か、データの種類や構造を設計する人材を育てることが不可欠だ」と指摘する。研究室や世代をまたいでデータを共有し何度も使うためには、その方法論を専門性の一つと位置付けて磨く必要がある。こうした経験が研究開発のDXを発展させた。
小さな国研の成果 科技戦略に反映
「第6期科学技術・イノベーション基本計画」では、データ駆動型研究はすべての学術分野に広げられる。研究データはどこまでオープンに共有して囲い込むか戦略を練り、データマネジメントプランを作らなければならない。プランに基づきデータの種別や作成者、アクセス権限を規定し、産学官のユーザーがデータを検索できるようにする。23年度までにすべての公募型研究資金に導入される。
内閣府の赤池伸一参事官は「データを検索するための情報を一律に求めた上で、システムにはアクセス権限を設定する。データを介した共同研究の促進につながるはず」とみる。すでに情報分野では科学誌よりも、査読前論文が集まる共有サイトと国際会議での査読審査で研究が評価されるようになった。確かな研究データをためて共有できれば、実験系の分野でも科学誌出版社に牛耳られない研究エコシステムを構築できる可能性がある。
「国の進む方向と一致」
物材機構は半信半疑の研究者をまとめて組織を作り、データ整備を進めてきた。文科省は全国の大学へ施策を広げる前に、物材機構で試して政策のひな型を作った。小さな国研だからこそ、異分野を取り込む柔軟さもあった。この知見は国の科学技術戦略に反映されている。総合科学技術・イノベーション会議の議員を務める橋本和仁物材機構理事長は「結果的に物材機構の苦労は国の進む方向と一致した」と振り返る。今後はこの知見を学術界に広げられるかが問われる。
【取材記者の追記】
国内ではあと二年で全学術分野にDMPなる、データ戦略構築能力が求められるようになります。最初は図書館の目録や図書館カードみたいなレベルなのですが、どこにどんなデータがあって、どんな様式で誰には提供可能か、このくらいは書くことになります。学術界で研究データを効率的に使う取組で、税金使うならデータ整理しろというメッセージにみえます。データをオープンにせずともシェアしてみなで使う、世代を超えて何度も使うためのインフラを整えていくことになります。
産業界ではビッグデータブームのころからデータ流通が推進されてきました。POSや天気など、いろんなビジネスデータを異業種と組んで使い倒そうという試みが進められています。研究開発領域もご多分に漏れず、データシェアや業界としての効率的活用が求められていきます。この難しさも有効性も、SIPなどの国プロに参加している大企業は経験してきました。内燃機関開発のプロジェクトではきっちりデータインフラを作って同業の競合が連携しました。他にも大量の生データはオープンにして解読ノウハウやツールをクローズにして相対で連携していく例もあります。同業や異業種が組んで、研究インフラを相乗りで作っていく試みです。
ただ合意形成が非常に難しく、国や業界としての戦略を各分野で作っていくことは困難を極めるかもしれません。ですが覇権争いをしている大国たちは桁の違う予算を組んで挙国一致でプロジェクト進めているようにみえます。オールジャパンは難しくても、産学連携でデータインフラや戦略を作っていかないといけません。そのデータインフラを武器に海外から資金や人材、データなどのを集める仕組みが要ります。
でないと、寡占化が進んだ学術誌出版社に掌握された学術界のようになりかねません。寡占化問題は十何年も前から指摘されてきたのにしっかり掌握されました。研究者一人一人は賢くても、研究者社会は必ずしも賢く振る舞えるとは限りません。出版社のマーケティングは進んでいて、論文に載った知識だけでなく、研究データやツールのレイヤーでも試行が始まっています。研究に使うデータ分析ツールも、論文も、データインフラも海外の特定事業者が提供している未来へ一歩一歩向かっているのかもしれません。
民間企業は自社の関わりのある研究分野の研究データがどう扱われているのか、組み方によっては自社の競争力になるのか、業界として研究開発力を高めるインフラはありえるのか、くらいはチェックしていく必要が出てくると思います。できれば、この二年間で全学術界がDMP策定に頭を悩ますので知恵を貸してあげてほしいです。ちなみに材料分野で苦労してきた方は「理想論では動かない。こつこつ実績を重ねるしかない。企業、業界、みんな言うことが違う。教育・医療・防災などの公的部門くらいしか連携を引き出せない」と漏らしています。ほっとくと20年かかりそうです。研究データのレイヤーからしっかり掌握される未来はくるんだと思います。