機械翻訳は果たして万能?管理者介在が不可欠
実務翻訳者の団体である日本翻訳連盟(JTF、東京都中央区)は24日、「第29回JTF翻訳祭2019」を横浜市西区のパシフィコ横浜で開いた。翻訳者の仕事術や人工知能(AI)を用いる機械翻訳の最新動向などが紹介され、翻訳に携わる約1500人が参加。昨年の2倍以上の参加者となり、盛り上がりを見せた。
フリー翻訳者の高橋さきの氏はセッション冒頭で、先日の台風19号上陸時に機械翻訳で「川に避難」と訳された防災メールが翻訳者の確認を経ずに外国人に送られた“事故”をまず紹介し、「機械翻訳を使う場合も人間が管理者としてあるべきだ」と強調した。さらに、こうした事例とは別に、翻訳の質の向上には原文考案者が描いた「絵」を思い浮かべて翻訳し、翻訳後は文章としての品質をしっかり確認することが必要だと説いた。
また人間の脳の学習処理を模したニューラル機械翻訳の進化に関する調査、機械翻訳出力結果の利用方法に関してのセッションなども行われた。
人工知能(AI)関連のニュースを聞かない日がないくらい、AIの話題が世の中にあふれている。AI導入の広がりや性能の向上など、21世紀に入ってからのAIの社会への普及には驚くばかりだ。その一方で、AIの性能向上に伴って、「AIが人間の仕事を奪うのでは」という懸念も聞かれる。金融機関の融資担当や保険の審査担当、電話オペレーター、レジ係などのほか、翻訳業界もよく挙げられる。脳の神経回路を模したニューラルネットワークを基礎にした「ニューラル機械翻訳(NMT)」が登場したことで、機械翻訳を用いるAIサービスの精度が格段に向上しており、「人間の翻訳者の仕事が無くなるのでは」との懸念も聞かれる。
しかし、現状ではある程度の質を求めるなら、機械翻訳後に人間の翻訳者が介在するのは不可欠になっている。当面はAIと人間との二人三脚が続くことになりそうだ。(取材・小川淳、狐塚真子)
翻訳業界で「グーグル・ショック」と呼ばれている出来事がある。2016年11月に米グーグルがオンラインのAI翻訳サービス「グーグル翻訳」の技術について、翻訳のルールを統計的に推定する「統計的機械翻訳」からNMTに変えたところ、文章間のぎこちなさが格段に減り、試してみた翻訳関係者が皆驚愕したという。実際、グーグルの検索サービスの一つ、「グーグル・トレンド」を見ると、16年11月に日本語での「ニューラル翻訳」の検索回数が大幅に増えており、そのインパクトの大きさがわかる。 以来、機械翻訳と言えばこのNMTが一つの基準になっている。膨大な対訳データを日々学習しており、その性能は着実に向上し続けている。
実務翻訳者の団体である日本翻訳連盟(JTF、東京都中央区)の東郁男会長は、「ある特定の分野の翻訳に限れば、機械翻訳はかなりの水準に到達している」と認めた上で、「機械翻訳の技術向上やそのスピードから目を背けることができなくなったのは確かだ」と指摘する。その一方で、「機械翻訳によって翻訳者の職が奪われるようなことは起きないだろう」と主張する。 なぜなら、人間と機械翻訳とでは「翻訳の質」の差が依然としてまだあり、すべてを機械翻訳に置き換えることは現実的ではないからだ。
少し前には、大阪メトロの「堺筋線」を「Sakai Muscle(サカイマッスル)」と誤訳したまま、大阪メトロの外国語ページに掲載していたことが話題になったが、これは米マイクロソフト製の機械翻訳サービスによる誤訳をそのまま掲載したためとみられる。
「Sakai Muscle」くらいなら笑い話で済むが、先日、東日本に大きな被害をもたらした台風19号が上陸した際にはこんなことも起きた。静岡県浜松市に住む日系ブラジル人向けに緊急メールが送られたが、その内容は誤って「川の周辺に避難してください」と逆に水位が上がって危険な川に人々を誘導しかねないようなものだったという。機械翻訳による翻訳ミスだったようで、日本語から英語、英語からポルトガル語へと翻訳する際、間違いが生じたようだ。当時はポルトガル語が分かる職員が不在で、確認できずにそのまま送ってしまった。
こうした事例はニュースになるので、多くの人に伝わるものの、日々の翻訳の現場では大小様々な間違いは生じている。「機械翻訳は、一見流ちょうに訳すため、かえって誤訳や訳抜け、二重翻訳などのミスを発見しにくい」との声も聞かれるほどだ。
また、使用する語彙が比較的少ない文章では、翻訳の精度はある程度保障されるものの、口語や小説といった文芸文書、固有名詞にはミスが生じる可能性が高い。試しに清少納言による随筆『枕草子』の、かの有名な一文を翻訳機にかけてみた。 機械が理解できる単語は英語に変換されるが、「あけぼの」という単語の様に、理解できない単語は固有名詞として扱われ、不思議な文章になった。2文目以降は「徐々に白くなっていく山ぎわ(山に接する空)が少し明るくなって、ー」という意味であるが、「山が白く変わって」という意味になってしまっている。
同様の部分をネイティブが翻訳すると、以下のような文章になる。その違いは一目瞭然だ。
「あけぼの」という単語はきちんと「dawn(夜明け)」として変換され、「ゆっくりと白くなる山の淵が赤く塗られていく」と、多少の表現の差はあるが、原文の意味を反映させた文章になっているのが分かる。
ところで、機械翻訳によってできあがった文章を人の手によって修正する作業を「ポストエディット(Post Edit)」と呼ぶが、現状では機械翻訳にかけた後、より正確さや精度を求めるのならこうした作業が欠かせない。
このため、実際には「確実に内容を伝えるため、費用や時間をかけても良いので、人に翻訳してもらいたい」という人もいれば、「多少翻訳のクオリティが低くても、読んで伝わる内容であれば良い」という理由で機械翻訳を選ぶ人もいる。例えば、海外の通販サイトやニュースサイトの情報は、「だいたいの内容を理解することが出来れば良い」という考えの人が多く、瞬時に翻訳することが出来る機械翻訳は重宝されやすい。こうした単に「読むための翻訳」のほか、ポストエディットの前の「下書き」のようなことなら、機械翻訳は現状でも十分活用できるといえる。
しかし、それでも機械翻訳が現状では決して人間にかなわない分野がある。それは小説や戯曲、詞や詩など、人の感情に訴える分野だ。消費者に訴求力が必要な企業の広告などもこうした範疇に入るだろう。
文章自体は流ちょうに訳していても、その言葉に込められたニュアンス、もっといえば文化的な背景や歴史的な意味、シャレや深い余韻、曖昧な表現などなど。日々学習しているとはいえ、その結果が正しいとは限らず、人間の翻訳者の修正を必要とする。こうした分野でもAI技術の進歩によって人手を必要としなくなる日がいずれはくるのかもしれない。しかし、逆に「50年経っても難しい」と主張する人もいる。そう考えると、人間の文章表現はほぼ無限大といえるほど、広大だ。改めて人間の表現の芳醇さには驚くばかりだ。さらに、日本語特有の文法や言い回し、尊敬語・謙譲語など、非日本語言語と比べ、明らかに参入障壁がありそうだ。
ところで、足下の翻訳者の需要はどうなのだろうか。データをみると、翻訳需要は着実に伸びている。米調査会社Nimdziによると、「世界全体の翻訳需要は確実に伸びており、市場成長率は6~7%の高水準」にあるという。グローバル化の進展で企業活動は世界に広がり、訪日外国人客(インバウンド)も政府が目標に掲げる年間4000万人達成に向け、着実に数字を伸ばしている。さらに、「日本企業に採用される外国人材や社内英語化の流れもあります」とJTFの東会長は指摘する。「2020年の東京オリンピック・パラリンピックの開催に向け、さまざまな業界で翻訳・通訳などの需要が伸びている」(東会長)ことも追い風といえる。
着実に伸び続ける翻訳需要に対応するためにも、機械翻訳を使いこなすことは翻訳者にとって不可欠なスキルになりつつある。決して「人間 VS AI」のような単純な話にはならず、それぞれの長所短所を把握しつつ、当面は「作業分担」をしていくことになるのかもしれない。
フリー翻訳者の高橋さきの氏はセッション冒頭で、先日の台風19号上陸時に機械翻訳で「川に避難」と訳された防災メールが翻訳者の確認を経ずに外国人に送られた“事故”をまず紹介し、「機械翻訳を使う場合も人間が管理者としてあるべきだ」と強調した。さらに、こうした事例とは別に、翻訳の質の向上には原文考案者が描いた「絵」を思い浮かべて翻訳し、翻訳後は文章としての品質をしっかり確認することが必要だと説いた。
また人間の脳の学習処理を模したニューラル機械翻訳の進化に関する調査、機械翻訳出力結果の利用方法に関してのセッションなども行われた。
翻訳者は「AI翻訳」に仕事を奪われるのか?
人工知能(AI)関連のニュースを聞かない日がないくらい、AIの話題が世の中にあふれている。AI導入の広がりや性能の向上など、21世紀に入ってからのAIの社会への普及には驚くばかりだ。その一方で、AIの性能向上に伴って、「AIが人間の仕事を奪うのでは」という懸念も聞かれる。金融機関の融資担当や保険の審査担当、電話オペレーター、レジ係などのほか、翻訳業界もよく挙げられる。脳の神経回路を模したニューラルネットワークを基礎にした「ニューラル機械翻訳(NMT)」が登場したことで、機械翻訳を用いるAIサービスの精度が格段に向上しており、「人間の翻訳者の仕事が無くなるのでは」との懸念も聞かれる。
しかし、現状ではある程度の質を求めるなら、機械翻訳後に人間の翻訳者が介在するのは不可欠になっている。当面はAIと人間との二人三脚が続くことになりそうだ。(取材・小川淳、狐塚真子)
翻訳業界を震撼させた「グーグル・ショック」
翻訳業界で「グーグル・ショック」と呼ばれている出来事がある。2016年11月に米グーグルがオンラインのAI翻訳サービス「グーグル翻訳」の技術について、翻訳のルールを統計的に推定する「統計的機械翻訳」からNMTに変えたところ、文章間のぎこちなさが格段に減り、試してみた翻訳関係者が皆驚愕したという。実際、グーグルの検索サービスの一つ、「グーグル・トレンド」を見ると、16年11月に日本語での「ニューラル翻訳」の検索回数が大幅に増えており、そのインパクトの大きさがわかる。 以来、機械翻訳と言えばこのNMTが一つの基準になっている。膨大な対訳データを日々学習しており、その性能は着実に向上し続けている。
人間とAIとの「翻訳の質」とは?
実務翻訳者の団体である日本翻訳連盟(JTF、東京都中央区)の東郁男会長は、「ある特定の分野の翻訳に限れば、機械翻訳はかなりの水準に到達している」と認めた上で、「機械翻訳の技術向上やそのスピードから目を背けることができなくなったのは確かだ」と指摘する。その一方で、「機械翻訳によって翻訳者の職が奪われるようなことは起きないだろう」と主張する。 なぜなら、人間と機械翻訳とでは「翻訳の質」の差が依然としてまだあり、すべてを機械翻訳に置き換えることは現実的ではないからだ。
少し前には、大阪メトロの「堺筋線」を「Sakai Muscle(サカイマッスル)」と誤訳したまま、大阪メトロの外国語ページに掲載していたことが話題になったが、これは米マイクロソフト製の機械翻訳サービスによる誤訳をそのまま掲載したためとみられる。
「Sakai Muscle」くらいなら笑い話で済むが、先日、東日本に大きな被害をもたらした台風19号が上陸した際にはこんなことも起きた。静岡県浜松市に住む日系ブラジル人向けに緊急メールが送られたが、その内容は誤って「川の周辺に避難してください」と逆に水位が上がって危険な川に人々を誘導しかねないようなものだったという。機械翻訳による翻訳ミスだったようで、日本語から英語、英語からポルトガル語へと翻訳する際、間違いが生じたようだ。当時はポルトガル語が分かる職員が不在で、確認できずにそのまま送ってしまった。
こうした事例はニュースになるので、多くの人に伝わるものの、日々の翻訳の現場では大小様々な間違いは生じている。「機械翻訳は、一見流ちょうに訳すため、かえって誤訳や訳抜け、二重翻訳などのミスを発見しにくい」との声も聞かれるほどだ。
また、使用する語彙が比較的少ない文章では、翻訳の精度はある程度保障されるものの、口語や小説といった文芸文書、固有名詞にはミスが生じる可能性が高い。試しに清少納言による随筆『枕草子』の、かの有名な一文を翻訳機にかけてみた。 機械が理解できる単語は英語に変換されるが、「あけぼの」という単語の様に、理解できない単語は固有名詞として扱われ、不思議な文章になった。2文目以降は「徐々に白くなっていく山ぎわ(山に接する空)が少し明るくなって、ー」という意味であるが、「山が白く変わって」という意味になってしまっている。
同様の部分をネイティブが翻訳すると、以下のような文章になる。その違いは一目瞭然だ。
“In spring, the dawn-when the slowly paling mountain rim is tinged with red . . .”
KYOTO JOURNAL,The Pillow Book: Translating a Classic>
「あけぼの」という単語はきちんと「dawn(夜明け)」として変換され、「ゆっくりと白くなる山の淵が赤く塗られていく」と、多少の表現の差はあるが、原文の意味を反映させた文章になっているのが分かる。
ところで、機械翻訳によってできあがった文章を人の手によって修正する作業を「ポストエディット(Post Edit)」と呼ぶが、現状では機械翻訳にかけた後、より正確さや精度を求めるのならこうした作業が欠かせない。
このため、実際には「確実に内容を伝えるため、費用や時間をかけても良いので、人に翻訳してもらいたい」という人もいれば、「多少翻訳のクオリティが低くても、読んで伝わる内容であれば良い」という理由で機械翻訳を選ぶ人もいる。例えば、海外の通販サイトやニュースサイトの情報は、「だいたいの内容を理解することが出来れば良い」という考えの人が多く、瞬時に翻訳することが出来る機械翻訳は重宝されやすい。こうした単に「読むための翻訳」のほか、ポストエディットの前の「下書き」のようなことなら、機械翻訳は現状でも十分活用できるといえる。
小説や広告の置き換えは困難!
しかし、それでも機械翻訳が現状では決して人間にかなわない分野がある。それは小説や戯曲、詞や詩など、人の感情に訴える分野だ。消費者に訴求力が必要な企業の広告などもこうした範疇に入るだろう。
文章自体は流ちょうに訳していても、その言葉に込められたニュアンス、もっといえば文化的な背景や歴史的な意味、シャレや深い余韻、曖昧な表現などなど。日々学習しているとはいえ、その結果が正しいとは限らず、人間の翻訳者の修正を必要とする。こうした分野でもAI技術の進歩によって人手を必要としなくなる日がいずれはくるのかもしれない。しかし、逆に「50年経っても難しい」と主張する人もいる。そう考えると、人間の文章表現はほぼ無限大といえるほど、広大だ。改めて人間の表現の芳醇さには驚くばかりだ。さらに、日本語特有の文法や言い回し、尊敬語・謙譲語など、非日本語言語と比べ、明らかに参入障壁がありそうだ。
翻訳需要は拡大 どう対応?
ところで、足下の翻訳者の需要はどうなのだろうか。データをみると、翻訳需要は着実に伸びている。米調査会社Nimdziによると、「世界全体の翻訳需要は確実に伸びており、市場成長率は6~7%の高水準」にあるという。グローバル化の進展で企業活動は世界に広がり、訪日外国人客(インバウンド)も政府が目標に掲げる年間4000万人達成に向け、着実に数字を伸ばしている。さらに、「日本企業に採用される外国人材や社内英語化の流れもあります」とJTFの東会長は指摘する。「2020年の東京オリンピック・パラリンピックの開催に向け、さまざまな業界で翻訳・通訳などの需要が伸びている」(東会長)ことも追い風といえる。
着実に伸び続ける翻訳需要に対応するためにも、機械翻訳を使いこなすことは翻訳者にとって不可欠なスキルになりつつある。決して「人間 VS AI」のような単純な話にはならず、それぞれの長所短所を把握しつつ、当面は「作業分担」をしていくことになるのかもしれない。
ニュースイッチオリジナルに加筆