ノイズや攻撃に強いAI、東大と理研が開発
東京大学の二見太大学院生と理化学研究所革新知能統合研究センターの杉山将センター長は、ノイズや攻撃に強い人工知能(AI)技術を開発した。学習データに異常データを混ぜるなどの攻撃を受けても、学習が発散しない。米マイクロソフトの対話AI「テイ」が人種差別的な発言などをしたように、AIはデータを学ぶ際に悪質なデータが紛れ込んでも無防備だった。
AIに学習させる大量データのデータ間の“距離”を算出し、距離が遠いデータは重要度を下げて扱う。距離が遠いノイズデータはAIに悪質な影響を与える。これによりノイズや攻撃データが混ざっても影響を小さくできる。これまでは一つ一つのデータを等しく扱う必要があった。
研究では異常データとの“距離”を無限にしても学習できることを実証した。従来技術では学習が発散してしまう。このノイズ耐性は、ベイズ推定とディープラーニング(深層学習)を組み合わせたAIでは初めてという。攻撃やノイズへの耐性ができたことで応用範囲が広がる。
工場のセンサーデータを深層学習する場合、計測値に一定の割合でノイズが混ざることが問題になっていた。深層学習はデータを大量に集めて学習することで一つ一つのデータの影響を薄める。だが一定割合で発生するノイズはデータ量を増やしても薄まらなかったが、新手法で対応する道が開けた。
アルゴリズムは、米グーグルの深層学習ライブラリ「テンソルフロー」で試せるようにソフトを開発し、公開した。
AIに学習させる大量データのデータ間の“距離”を算出し、距離が遠いデータは重要度を下げて扱う。距離が遠いノイズデータはAIに悪質な影響を与える。これによりノイズや攻撃データが混ざっても影響を小さくできる。これまでは一つ一つのデータを等しく扱う必要があった。
研究では異常データとの“距離”を無限にしても学習できることを実証した。従来技術では学習が発散してしまう。このノイズ耐性は、ベイズ推定とディープラーニング(深層学習)を組み合わせたAIでは初めてという。攻撃やノイズへの耐性ができたことで応用範囲が広がる。
工場のセンサーデータを深層学習する場合、計測値に一定の割合でノイズが混ざることが問題になっていた。深層学習はデータを大量に集めて学習することで一つ一つのデータの影響を薄める。だが一定割合で発生するノイズはデータ量を増やしても薄まらなかったが、新手法で対応する道が開けた。
アルゴリズムは、米グーグルの深層学習ライブラリ「テンソルフロー」で試せるようにソフトを開発し、公開した。
日刊工業新聞2018年5月11日