もう科学論文のねつ造は許さない。画像データの不正を検出するAI
エルピクセルが開発。幾何変形はほぼ100%の精度で検出
エルピクセル(東京都文京区、島原佑基社長、03・6327・3992)は、科学論文の画像データの不正を検出する人工知能(AI)技術を開発した。画像データの類似度を算出し、データの使い回しや加工などを見つける。加工や再利用が元画像の一部であっても部分一致率が高ければ検知できる。大手科学雑誌編集部に採用された。2017年前半にサービス提供を始める。
画像データの捏造(ねつぞう)では、元画像をぼやかすなどのノイズを加えたり、反転や回転、伸縮させたりしてデータを作成する。実際に実験していなくても画像を加工して新しい実験結果として提出される。この加工画像の元データをディープラーニング(深層学習)で検出する。幾何変形はほぼ100%の精度で検出できるという。
生命科学分野ではインターネット上で自由に閲覧できる420万論文の画像データと照会でき、既報の論文から転用している例を検知できる。科学雑誌編集部が利用すれば過去の投稿データ、大学の不正管理部門が利用すれば博士論文など大学保有のデータと照会できる。
雑誌編集者や大学管理者にとっては照合するデータが類似性の高いモノに絞れるため、作業負荷を大幅に減らせる。
エルピクセルにとっては捏造や怪しいデータを、AIサービスを通して蓄積できる。利用が広がるほど検出精度が向上し、画像加工のパターンごとに、より高精度のAIを構築できる。
画像データの捏造(ねつぞう)では、元画像をぼやかすなどのノイズを加えたり、反転や回転、伸縮させたりしてデータを作成する。実際に実験していなくても画像を加工して新しい実験結果として提出される。この加工画像の元データをディープラーニング(深層学習)で検出する。幾何変形はほぼ100%の精度で検出できるという。
生命科学分野ではインターネット上で自由に閲覧できる420万論文の画像データと照会でき、既報の論文から転用している例を検知できる。科学雑誌編集部が利用すれば過去の投稿データ、大学の不正管理部門が利用すれば博士論文など大学保有のデータと照会できる。
雑誌編集者や大学管理者にとっては照合するデータが類似性の高いモノに絞れるため、作業負荷を大幅に減らせる。
エルピクセルにとっては捏造や怪しいデータを、AIサービスを通して蓄積できる。利用が広がるほど検出精度が向上し、画像加工のパターンごとに、より高精度のAIを構築できる。
日刊工業新聞2017年2月16日