科学論文や特許の大規模解析にAI活用。NISTEPが得た効果

類似特許、抽出時間短縮

  • 2
  • 23
NISTEPでの調査分析(イメージ)

文部科学省の科学技術・学術政策研究所(NISTEP)は科学論文や特許などの大規模解析に人工知能(AI)技術を活用している。AI活用で膨大な量のデータを扱えるようになった。例えば日本の特許400万件の類似特許を抽出するのに8時間しか要しない。分析手法はツール化しており、文科省の全職員が扱える。AIの専門家に分析を頼むのでなく、各自の多彩な観点で分析できるようになった。

新しい視点導入

「AI技術で政策研究に新しい視点を導入する」とNISTEPの岡谷重雄総務研究官は力を込める。理化学研究所(理研)革新知能統合研究センターからAIの研究者を招き、自然言語処理や因果推論などの技術を導入した。従来も、論文の引用ネットワーク構造から注目される論文や研究領域を抽出する研究はあった。ここに自然言語処理の文脈推定を加えると、論文を肯定的に引用したのか否定するために引用したのか分析できる。従来は多く引用された論文が影響度の大きい研究と評価されてきたが、賛否を含めた深い評価ができるようにした。

因果推論では博士研究員(ポスドク)のキャリアについて分析する。学生への経済支援や研究予算など、どんな因子が進学率や就学率にどの程度寄与しているか推定する。岡谷総務研究官は「AI研究者にとって政策研究は非常に面白い応用領域。政策研究者とのコラボが始まっている」と目を細める。

一段深く分析

小柴等主任研究官は「従来はデータ量の問題もあり全体分析は難しかった」と振り返る。AI技術は解析できるデータの規模を拡大させた。特許の類似度算出では日本の過去15年の400万件の特許を扱う。1件の特許に対して200件の類似特許を抽出するのに7ミリ秒(0・007秒)しかかからない。400万件すべてに実行しても8時間かからない。扱えるデータ規模が拡大し全体を見やすくなった。同時に分析内容ももう一段深くなる。こうした分析手法は検索ツールとして文科省職員はみな使えるようにしている。

研究成果発掘へ

目下の関心はノーベル賞級の研究成果をAI技術で発掘できるかどうかだ。機械学習は過去のデータから研究者たちの論文への評価を学ぶ。ノーベル賞級の成果は当時の研究者に評価されず、論文審査で弾かれたものが少なくない。つまり研究者たちの現在の評価尺度を学ぶだけでは発掘は難しい。小柴主任研究員は「現在は評価されていないが、優れた研究を浮かび上がらせられると、萌芽(ほうが)的な段階から大切に育てられる」と説明する。AI技術で科技政策を進められるか注目される。(小寺貴之)

日刊工業新聞2021年6月25日

関連する記事はこちら

特集