AIで特許・論文の類似度を分析、NISTEPがツール開発
科技政策の立案を支援
文部科学省の科学技術・学術政策研究所(NISTEP)の小柴等主任研究官は、人工知能(AI)技術で特許や科学論文の類似度を求める分析ツールを開発した。広範な研究活動を分類したり、似た研究を検索したりできる。検索システムのようなツールとし、NISTEPに加えて文科省の職員が使える。科技政策の立案や学術界の俯瞰(ふかん)的分析を支援する。
自然言語処理技術で研究開発の類似度を算出する。特殊なインデックスを用いて、類似しそうなものだけに絞って類似度を計算する。既存技術は全ての内容について類似度を求めていた。先に絞り込むことで計算負荷を抑えた。例えば1件の特許に対して200件の類似特許を求めるのに7ミリ秒と高速で計算が終わる。過去15年分の特許400万件に対し類似度を求めるのに7時間47分で済む。
技術としては、特許の文章を数値ベクトルの分散表現にして、高次元ベクトル近傍探索という技術で近しい特許を探す。特許全体で数値ベクトルを約300次元に抑えたため高速処理できた。特許全体を俯瞰して分析できる。
科学論文と特許に応用し、検討している特許に内容が似ている論文を探すこともできる。類似研究の探索では「医療」と「人工知能」で検索すると「深層学習を用いた肺画像診断」がヒットする。従来のキーワード検索では「医療」や「人工知能」と明記された内容がヒットしていた。AI技術で言葉の意味をくんだ検索が可能になった。研究動向の網羅的な把握や類似研究の分析がしやすくなる。
日刊工業新聞2021年6月14日