技術文章と法令文の類似度を算出するAI技術の仕組み
日立製作所研究開発グループは、技術文章と輸出管理法令を関連付けて照会する技術を開発した。英語を介して技術文章と法令文の類似度を人工知能(AI)技術で算出する。英語を介することで表記揺れを抑えた。輸出管理担当者が確認すべき法令を探し当てる負荷を低減できると見込まれる。
企業の複数拠点間でデータを共有するなどの国をまたぐデータ移動を想定する。技術情報を国境を越えて移動させると輸出管理法令の規制対象になる。そこで技術文章に関連する法令をAI技術で探し当てる。
まず英語法令文や英語技術文章を合わせてAIの言語モデルを構築する。同モデルで技術文章や法令文から文ベクトルを算出する。文ベクトルのコサイン距離を計算して文章の類似度を判定する。
輸出関連法令は法務省から英訳された法令文が提供されており、翻訳の質が高い。技術文章は人手や機械学習で翻訳した英文を用いる。英語を介することで技術用語などの表記揺れを抑えられる。
実験では米国再輸出規制の関連項目を73%の割合で提示できた。情報の共有前に法務部が確認し承認する負荷を減らせる。輸出管理関連法案は頻繁に改定されるため技術者が最新情報を把握するのは難しい。違反原因の47%が知識の欠如や見落としで、故意・重過失は11%と、うっかりが半数を占めている。
日刊工業新聞2022年6月29日