ニュースイッチ

【国際ロボット展・特別プログラム】音声認識サービスの今と未来

12月2日に開催、河原京大教授など第一人者が登壇
【国際ロボット展・特別プログラム】音声認識サービスの今と未来

ソニーのAIスピーカー「LF−50G」。音質や臨場感に加え、操作性を重視した

 LINEや米アマゾン、グーグル、さらにはロボットに再参入したソニーといった企業が続々と人工知能(AI)スピーカを発売し、音声によるインターフェースの時代が訪れようとしている。音声認識は騒がしい場所での聞き取りが不十分など、まだ発展途上の技術だが、ディープラーニング(深層学習)の活用により多様な音声認識が可能となっており、日々の業務や暮らしへの広がりが期待される。

 日刊工業新聞社では12月2日に国際ロボット展の会場内で、「音声認識サービスの今と未来」をテーマにしたプログラムを開催する。基調講演は音声認識技術の第一人者である京都大学の河原達也教授が同分野の技術トレンドを語る。

 後半のパネルディスカッションは、実際に音声認識技術やAIを用いたサービスを展開している気鋭のベンチャー2社の代表が登壇。過去の研究プロジェクトや最新動向を紹介する。また、長時間会話した音声データを文字にする議事録作りのような仕事への応用や、新聞記者のような記事作成システムの実現可能性についても議論する。
  
<日時> 12月2日(土) 15:00~16:30
<会場> 「2017国際ロボット展」東京ビッグサイト・東6ホール内メインステージ  
<主催> モノづくり日本会議、日刊工業新聞社
<登壇者>
・京都大学教授 河原 達也 氏
・サインウェーブ代表取締役社長 赤池 雅光 氏
・澪標アナリティクス代表取締役社長 井原 渉 氏
<モデレーター>
・日刊工業新聞社編集局第一産業部記者 石橋 弘彰

聴講希望の方はこちらから登録して下さい


「マツコ」ではなく「エリカ」です!


 大阪大学大学院基礎工学研究科の石黒浩教授と京都大学大学院情報学研究科の河原達也教授らの研究グループは3日、自律対話型アンドロイド「ERICA(エリカ)」を開発したと発表した。顔は日本人と欧米の人のハーフに見えるように、コンピューターグラフィックスで整った顔を作成した。音声認識や音声生成、相づちといった動作生成などの先端技術を統合し、自然なしぐさで対話できる。

 顔は左右対称で鼻と口、あごが一直線に並ぶなど、人工的に顔を修正した。石黒教授は「誰がみても美しく見える顔に仕上げた」としている。喜怒哀楽などさまざまな表情を作れる。肖像権がなく、研究に使いやすい。

 研究グループは今後、相手の意図をくんだ対話が可能なモデルを作製する計画。受け付けやカウンセリングなど利用する場面を限定した上で、より自然な対話を目指す。
河原教授や阪大石黒教授らが開発したアンドロイド「ERICA」


英語テストをAIで採点−手書き答案に対応


 サインウェーブ(東京都千代田区、赤池雅光社長)は、人工知能(AI)を使い英語テストの手書きの回答を自動採点するサービスを開発した。AIの画像解析エンジンで手書きの英文を読み取り採点する。採点結果を自動でデータ化でき、個人の学習状況の管理や、生徒全体の傾向分析にデータを生かせる。価格は生徒1人当たり月額1000円から。学校や塾、英会話教室などへ提案する。

 サービス名は「英語手書き認識採点システムSiF」。生徒や教師が英語の手書き答案をスマートフォンのカメラやプリンターなどで読み取り、サインウェーブへ送る。送ったデータをサインウェーブ側のクラウドで自動採点し、結果を一覧にする。採点項目は単語の間違いや構文のミス、上手な表現方法など。問題や回答、結果分析はサインウェーブが学習したデータを持っており、教師はデータから問題を選ぶ形になる。

 従来の紙のテストは、採点結果を教師がデータ入力しないと情報として管理できなかった。同サービスを使うと、単語や問題傾向、生徒別のデータを簡単に活用できる。

日刊工業新聞2017年9月27日



「チャットボット」活用で自然対話


 澪標アナリティクス(東京都中央区、井原渉社長)は、あらゆるマニュアルを会話調の自然な問いかけで検索できるシステム「マニュアルチャット」を開発した。人工知能(AI)が利用者と自然対話でやりとりする「チャットボット」技術を活用。画面レイアウトを一般的な検索サイトに近づけてボットの使いにくさを解消した。年20―30件のユーザー獲得を目指す。

 業務上書類を調べることが多い金融や行政、製造業など幅広い利用が期待できる。製品の消費者向けサービスとしての提供も可能。システムは受託して構築し、形態はクラウドサービス、クローズ型などに応じる。

 利用者が「カジノの法律について教えて」と入力すると、AIが意図を類推してカジノに関する法律に関してのデータを表示する。関連する項目をAIが理解しており、例えば「信託財産留保額」という言葉で検索すると「解約金」という似た言葉の項目も表示する。一般的な検索サイトと違い、検索ワードが全く入っていない項目も関連したものを出せることが特徴だ。

 事前に類似語や専門用語の辞書データベースを澪標が作成する。ユーザー側でデータを増やしたり変更したりでき、更新の手間が少ない。

 チャットボットはテキストや音声で自動対話するソフトウエアロボットで、米アップルの「Siri(シリ)」や同マイクロソフトの女子校生AI「りんな」が代表的だ。チャット画面で自然な対話をしつつ商品を買ったり旅行プランを決めたりできる。

 一般的なチャットボットは利用者からのチャットでの最初の問いかけと次の問いかけの内容がつながっているのか、全く別の話題なのか分からない。澪標のシステムは検索画面調にしたことで、利用者が一つの質問項目で一気に検索するため、AIが問いかけごとのつながりを判断せずに済む。

 また、チャットボットの利用者はボットへあいさつや雑談を投げかける。ボットが雑談を理解するのは難しいが、検索画面調だとそれがなくなるのでAIの負担が減るという。

日刊工業新聞2017年6月21日

明豊
明豊 Ake Yutaka 取締役デジタルメディア事業担当
今、最もホットな分野。阪大の石黒教授は「AIスピーカーでデバイスの価格下落や音声認識の精度向上が進んだ。だがAIスピーカーがゴールではない。この技術や環境変化をうまく取り込んだプレーヤーが次のコミュニケーションロボットの競争で優位に立つだろう」と話す。登壇する3人の方の知見をぜひ今後の参考にして下さい。

編集部のおすすめ