パナソニックやNECも採用、NICTが開発した多言語音声翻訳技術のスゴさ
先進的音声翻訳研究開発推進センターの木俵豊センター長に聞く
情報通信研究機構(NICT)が開発する多言語音声翻訳技術が、民間企業の製品やサービスに採用され始めた。パナソニックやNECなど、大企業向けの事例も多い。ただ人工知能(AI)を活用した精度向上の取り組みは国際競争が激化する。NICTの先進的音声翻訳研究開発推進センター(ASTREC)の木俵豊センター長に、取り組む翻訳技術の動向を聞いた。
―NICTの多言語音声翻訳技術は、スマートフォン向け音声翻訳アプリケーション「ボイストラ」として広く知られています。
「ボイストラはあくまで実証実験用のアプリ。これを通じてNICTの翻訳技術を知ってもらい、民間企業への技術移転につなげている。その後は技術移転した企業同士で連携し、それぞれの製品の改善を進めてもらう」
―ディープラーニング(深層学習)を使う「ニューラル機械翻訳」により、従来の統計翻訳と比べて大幅に精度が向上しました。
「我々の技術は自然で分かりやすい文章に翻訳できるのが特徴。深層学習は層を増やせば性能が上がるが、従来は膨大な計算量を処理できなかった。それが画像処理半導体(GPU)を使う汎用計算(GPGPU)の活用で可能となった。産業技術総合研究所がAI技術用として整備中のGPU基盤と連携し、開発を進めている」
―単語の抜け落ちなど、深層学習ならではの誤訳もあります。
「深層学習でなぜ精度が上がるのか、逆に問題が起こるのか、誰も説明できない。トライアル・アンド・エラーでさまざまなデータを学習させるしかない。NICTは『翻訳バンク』という仕組みで、企業から幅広くデータを収集している。それを分野ごとに整理し、各分野の翻訳エンジンをつくっている」
―世界的にグーグルがGPGPUを大規模に活用し、急速に翻訳精度を高めています。
「日本企業は規模では立ち行かない。また日本は著作権や個人情報保護に慎重な考えがあり、データ共有も進めにくい。グーグルに真っ向勝負するのでなく、データを活用しやすくするなどの法整備が重要となる。NICTとしても研究開発したものをより発展できるよう、民間企業へ技術移転を進めていく」
―NICTの多言語音声翻訳技術は、スマートフォン向け音声翻訳アプリケーション「ボイストラ」として広く知られています。
「ボイストラはあくまで実証実験用のアプリ。これを通じてNICTの翻訳技術を知ってもらい、民間企業への技術移転につなげている。その後は技術移転した企業同士で連携し、それぞれの製品の改善を進めてもらう」
―ディープラーニング(深層学習)を使う「ニューラル機械翻訳」により、従来の統計翻訳と比べて大幅に精度が向上しました。
「我々の技術は自然で分かりやすい文章に翻訳できるのが特徴。深層学習は層を増やせば性能が上がるが、従来は膨大な計算量を処理できなかった。それが画像処理半導体(GPU)を使う汎用計算(GPGPU)の活用で可能となった。産業技術総合研究所がAI技術用として整備中のGPU基盤と連携し、開発を進めている」
―単語の抜け落ちなど、深層学習ならではの誤訳もあります。
「深層学習でなぜ精度が上がるのか、逆に問題が起こるのか、誰も説明できない。トライアル・アンド・エラーでさまざまなデータを学習させるしかない。NICTは『翻訳バンク』という仕組みで、企業から幅広くデータを収集している。それを分野ごとに整理し、各分野の翻訳エンジンをつくっている」
―世界的にグーグルがGPGPUを大規模に活用し、急速に翻訳精度を高めています。
「日本企業は規模では立ち行かない。また日本は著作権や個人情報保護に慎重な考えがあり、データ共有も進めにくい。グーグルに真っ向勝負するのでなく、データを活用しやすくするなどの法整備が重要となる。NICTとしても研究開発したものをより発展できるよう、民間企業へ技術移転を進めていく」
日刊工業新聞2018年7月23日