ニュースイッチ

離れた所でも人の声を認識、NTTがAIで実現

 NTTは人工知能(AI)を活用し、離れた場所でも人の声を認識できる遠隔音声認識技術を開発した。ディープラーニング(深層学習)を用いて認識モデルを構築し、スピーカーマイクから3メートル離れた場所でも約90%の認識率を実現する。車載型や据え置き型スピーカーマイクなどの音声入力に対応する。グループ会社を通じて、今夏の製品化を目指す。

 NTTはもともと雑音環境での音声認識技術を保有しており、これに音の揺れを吸収するAIを組み合わせて新たな認識モデルを構築した。クリーンな音声にさまざまな雑音を模擬的に生成した環境下で、AIが学習し認識精度を高めた。従来技術ではマイクから1メートル離れた場所で、約90%の認識率だった。

 AIスピーカーやコネクテッドカー(つながる車)の時代に求められる車載器の音声操作での活用を想定。これらの音声認識プラットフォームに今回の技術を用いてスピーカーと連携させる。
日刊工業新聞2018年2月27日
日刊工業新聞記者
日刊工業新聞記者
例えば、家のリビングにスピーカーを置いても台所など離れた場所から聞き取れる。また車内の天井にマイクを設置すれば、助手席や後部座席の音声を認識して車載器を操作できる。 (日刊工業新聞第一産業部・清水耕一郎)

編集部のおすすめ