METI
【松尾豊】AIロボット「日本企業はピークの20代につまらない作業をさせている」
AI研究の第一人者「フライングでも進めないとビジネスでは勝てない」
ロボットとともに働き、ともに生活する―。そんな世界が急速に近づいてきた。ディープラーニング(深層学習)で画像認識精度が向上し、ロボットが“目”を獲得したように、人工知能(AI)技術がロボットの開発戦略を大きく変えた。第1回目は、東京大学特任准教授の松尾豊さんのインタビュー。ロボットの新潮流を見据え、日本企業はどう戦っていけばいいのか語ってもらった。
―AI技術の進化はロボットにどんな影響を与えますか。
「簡単に言うと、ロボットは目が見えるようになった。2015年にディープラーニングで画像認識の精度が人間を超えた。モノを認識してつかんだり、操作したり、作業ができるようになる。これまでのロボットは目が見えない状態で、単純な動作を繰り返していただけだ。それでも失敗しなかったのは人間が周辺の環境を整えていたからだ。工場の生産ラインでは必ず特定の場所に、決まった部品が配置される。ロボットは作業の対象が何であるかわからなくてもいい。同じ動きを繰り返すだけで作業が成り立つ」
「反対に、周辺環境を整えられない場所ではロボットは役に立たなかった。未知の環境では歩くこともできない。目ができたことで、人間が周辺環境をお膳立てしなくても、ロボットが働けるようになる。また人間が目で見て判断しながらやらないといけなかった作業がロボット化できるようになる。食品工場での食材加工や物流倉庫での商品仕分けなど、扱う対象が頻繁に変わる作業にロボットを導入できる。こうした現場は人手不足で困っておりロボットの普及は進むだろう」
―身近な例を挙げるといかがでしょう。
「洗濯機や電子レンジ、冷蔵庫など、家電は多くの作業を機械化してきた。ただ衣類を洗濯機に入れる、食材を冷蔵庫に入れる、食材を取り出して料理するといった作業はまだ人間が行っている。これは機械が見て認識できなかったためだ。片付けや料理は昔からロボットの実用例とされてきた。目ができ、技術的にはできるようになった。家電市場は倍以上に増えるだろう。どのようにビジネスとして切り取るか競争が始まっている」
―画像認識AIの人間越えは2015年です。2年がたち機は熟しましたか。
「ITがそうであるように、すべてはタイミングだ。情報検索の技術は60年-70年代から、ずっと開発されていたがインターネットの普及で広がった。動画配信技術も90年代には開発されていたが、ブロードバンドが普及し、ユーチューブが2000年代に広がった。現在、医療画像診断やセキュリティーの顔認証では人間を超えている。画像だけで完結するサービスは産業界で実用化が進んでいる。ロボットへの応用はコストの問題もあり時間がかかっているが、日本企業は得意なはずだ」
―米グーグルがロボットで80万回、モノをつかむ作業を繰り返して、ピッキングをAIに学習させました。80万回を多いと考えるかどうか。ロボットにAIを応用する技術課題は何でしょう。
「大量データのディープラーニングと強化学習を組み合わせて『深層強化学習』が実現したとはいうものの、まだ強化学習が未成熟で何十万回も繰り返しデータを集めないといけない。強化学習において事前学習として次元削減の技術がきちんとできていないのが原因だが、今後大きく変わるはずで、そうなれば状況は一変するだろう。また、シミュレーション技術が重要になっている。コンピューターの中でシミュレーションできれば実際にロボットが繰り返さなくても大量のデータを増幅できる。囲碁AIが自己対局でデータを増やしたことと同じだ。ただシミュレーションは何を再現すればシミュレーションしたことになるのか難しく、学術的にも面白いところだ。日本の企業は各技術が成熟するのを待たず、すぐに着手した方が良い。フライングでも進めないとビジネスでは勝てない」
―ハードウエア開発はベンチャーには荷が重いとされます。AIロボットは大企業に有利な市場ではありませんか。
「確かにハードウエアは製造技術など、要素のすり合わせが多く、ベンチャーだけでやるのは厳しい。AIに強いベンチャーとモノづくり系の大企業の連携が一つのモデルになる。AI技術の進化は速く、ベンチャーのように即応できないとついていけない。ベンチャー側が売り上げを立てて、大企業との交渉力を持ち続ける必要がある。できなければ大企業は抱え込もうとする。イスラエル・モービルアイ(自動運転用画像認識VB)が米インテルに買収されたように、ベンチャーが特定の企業に依存しないように取引を分散させるなど戦略が要る。日本にもファナックとプリファードネットワークスの協業など先行例はある。ただ数が足りない。今後、成功例が増えていってほしい」
「投資のあり方も変えないといけない。これまで製造業は生産設備や製品に投資してきた。これからデータと人に投資することになる。データはそのまま競争力に直結する。データをAIに学習させると精度が上がり、できる機能も増えていく。データが直接サービスの質を向上させる。検索が良い例で、AIのアルゴリズムだけが優れていても、それを支えるデータがなければ学習できない。アルゴリズムはコピーできても、データが生成され続ける仕組みはマネできない。優れたサービスはユーザーを増やし、学習データも増やす。ユーザーが増えると新しい機能やサービスを試すテスト環境も豊かになり、新サービスを素早く実装できる。この好循環が回り出すと後続組は追いつけなくなる」
「製造業は製造技術やノウハウで製品の質を高めてきた。今後はモノづくりのノウハウを持っていても、データがなければ競争に参加できなくなる。対策はいち早く製品を出すことだ。医療画像へのAI応用は米FDAで出てきている。画像認識AIの競争はもう終盤。次は機械系だ」
―データはプライバシー問題があります。AIスピーカーの普及が期待されていますが、データ収集端末になれるかどうか。
「おもてなしとプライバシーは表裏一体だ。旅館や料亭の仲居さんも気を回すために、お客の個人情報を知っているが、お客に信頼されている。プライバシーは日本的な方法で解決したいところだ。半分冗談だが、人の顔をアニメや動物の顔にするだけで人はなごむ。画像認識などAIのアルゴリズムは顔の写真がそのまま必要なわけではない。機械的に抽象化した情報があれば十分だ。マーケティングではデータから個人を特定したいのではなく、振る舞いを予想したいだけだ。商品選びが他の人と似ているか、次にどんな商品を求めるか推定して先回りできればいい。顔や自身が調べられると不快だという感情には、日本なりの
解決策を見つけたい」
―プライバシーをクリアしたとしても、データだけが集まればいいわけではありません。どんな意味を持つデータか、ラベルをつけないとAIが学習できないのでは。
「農業用のデータなら農家にラベルをつけてもらうしかない。SNSで流れているデータは、ユーザーが写真と一緒に状況説明や感想を挙げる。ユーザーが自発的に楽しんで行い、SNSにラベルのついたデータが集まる仕組みだ。これに似た仕組みを現場の専門家と作り上げる必要がある。初めはお金を払ってデータにラベルをつけてもらう必要もあるだろう。データへの投資とは、単にデータを集めるだけでなく、良質なデータが集まるビジネスモデルを構築することでもある」
―専門知識は先進国が有利ですが、簡単なデータ加工は新興国など人件費の低い社会の方が有利ですね。
「最近、エチオピアを訪ねる機会があった。貧しく道路や家はボロボロで、料理もあまり美味しくない。だが服と車はきれいで日本で売られている商品とあまり変わらなかった。これはアジアで安く生産され、世界中に流通しているためだ。衣服や車、食材などデリバー(物流で運べる)できる商品は後進国も先進国もほぼ変わらず、建物や交通インフラ、料理など、デリバーできないモノ、その場で作らねばならない料理や建築物は貧しいままだ。だが、これらもロボットによってデリバーできるようになる。人間がその場で作ってきたのは、目が必要だったからだ。目を持ったロボットが代わりに働けば、世界中、同じ品質の仕事ができる。今後、商品やサービス、インフラも世界中で差がなくなっていく」
「そしてサービスを買いながらデータを提供する社会と、サービスを提供して収集したデータでサービスを改良し、技術開発で利益を上げる社会の二つに分かれるだろう。日本はどちらを選びたいか。サービスを提供する側に回りたければ、商品やサービスで世界からデータを集めるビジネスモデルをつくるしかない。米国や中国は始めていて、商品やサービスが出てきている。日本企業はいままで通り、普通に戦えば普通に負ける。ITで負けてきた歴史を繰り返すだけだ。戦い方を変えなければならない」
―IoTやウェブサービスは各社がデータ独占を競っていて、製造業など既存の産業ではバリューチェーンのデータ化が進んでいます。ただ独占競争というよりは費用対効果を測りかねている印象があります。いまからでも勝てそうな分野は。
「低頻度でデータが出てくる分野だろう。高頻度でデータが得られる分野はちゃんと集めれば良い。低頻度な分野は、勝ちモデルが決まっていない。製品やロボットを通して初めて、データが集められるようになる分野は独占しやすい。ハードウエアが技術的に難しければ他は参入しにくく、リスクをとって先にハードを普及させる戦略もある。いずれにせよ、端から見て勝ちモデルが明確になった段階で勝敗がついているか、参入機会を逃している」
<次のページ、60代が技術を理解できなければ流れてしまう>
ロボットの目が見えるように
―AI技術の進化はロボットにどんな影響を与えますか。
「簡単に言うと、ロボットは目が見えるようになった。2015年にディープラーニングで画像認識の精度が人間を超えた。モノを認識してつかんだり、操作したり、作業ができるようになる。これまでのロボットは目が見えない状態で、単純な動作を繰り返していただけだ。それでも失敗しなかったのは人間が周辺の環境を整えていたからだ。工場の生産ラインでは必ず特定の場所に、決まった部品が配置される。ロボットは作業の対象が何であるかわからなくてもいい。同じ動きを繰り返すだけで作業が成り立つ」
「反対に、周辺環境を整えられない場所ではロボットは役に立たなかった。未知の環境では歩くこともできない。目ができたことで、人間が周辺環境をお膳立てしなくても、ロボットが働けるようになる。また人間が目で見て判断しながらやらないといけなかった作業がロボット化できるようになる。食品工場での食材加工や物流倉庫での商品仕分けなど、扱う対象が頻繁に変わる作業にロボットを導入できる。こうした現場は人手不足で困っておりロボットの普及は進むだろう」
―身近な例を挙げるといかがでしょう。
「洗濯機や電子レンジ、冷蔵庫など、家電は多くの作業を機械化してきた。ただ衣類を洗濯機に入れる、食材を冷蔵庫に入れる、食材を取り出して料理するといった作業はまだ人間が行っている。これは機械が見て認識できなかったためだ。片付けや料理は昔からロボットの実用例とされてきた。目ができ、技術的にはできるようになった。家電市場は倍以上に増えるだろう。どのようにビジネスとして切り取るか競争が始まっている」
すべてはタイミング
―画像認識AIの人間越えは2015年です。2年がたち機は熟しましたか。
「ITがそうであるように、すべてはタイミングだ。情報検索の技術は60年-70年代から、ずっと開発されていたがインターネットの普及で広がった。動画配信技術も90年代には開発されていたが、ブロードバンドが普及し、ユーチューブが2000年代に広がった。現在、医療画像診断やセキュリティーの顔認証では人間を超えている。画像だけで完結するサービスは産業界で実用化が進んでいる。ロボットへの応用はコストの問題もあり時間がかかっているが、日本企業は得意なはずだ」
―米グーグルがロボットで80万回、モノをつかむ作業を繰り返して、ピッキングをAIに学習させました。80万回を多いと考えるかどうか。ロボットにAIを応用する技術課題は何でしょう。
「大量データのディープラーニングと強化学習を組み合わせて『深層強化学習』が実現したとはいうものの、まだ強化学習が未成熟で何十万回も繰り返しデータを集めないといけない。強化学習において事前学習として次元削減の技術がきちんとできていないのが原因だが、今後大きく変わるはずで、そうなれば状況は一変するだろう。また、シミュレーション技術が重要になっている。コンピューターの中でシミュレーションできれば実際にロボットが繰り返さなくても大量のデータを増幅できる。囲碁AIが自己対局でデータを増やしたことと同じだ。ただシミュレーションは何を再現すればシミュレーションしたことになるのか難しく、学術的にも面白いところだ。日本の企業は各技術が成熟するのを待たず、すぐに着手した方が良い。フライングでも進めないとビジネスでは勝てない」
ベンチャー、大企業連携が一つのモデル
―ハードウエア開発はベンチャーには荷が重いとされます。AIロボットは大企業に有利な市場ではありませんか。
「確かにハードウエアは製造技術など、要素のすり合わせが多く、ベンチャーだけでやるのは厳しい。AIに強いベンチャーとモノづくり系の大企業の連携が一つのモデルになる。AI技術の進化は速く、ベンチャーのように即応できないとついていけない。ベンチャー側が売り上げを立てて、大企業との交渉力を持ち続ける必要がある。できなければ大企業は抱え込もうとする。イスラエル・モービルアイ(自動運転用画像認識VB)が米インテルに買収されたように、ベンチャーが特定の企業に依存しないように取引を分散させるなど戦略が要る。日本にもファナックとプリファードネットワークスの協業など先行例はある。ただ数が足りない。今後、成功例が増えていってほしい」
「投資のあり方も変えないといけない。これまで製造業は生産設備や製品に投資してきた。これからデータと人に投資することになる。データはそのまま競争力に直結する。データをAIに学習させると精度が上がり、できる機能も増えていく。データが直接サービスの質を向上させる。検索が良い例で、AIのアルゴリズムだけが優れていても、それを支えるデータがなければ学習できない。アルゴリズムはコピーできても、データが生成され続ける仕組みはマネできない。優れたサービスはユーザーを増やし、学習データも増やす。ユーザーが増えると新しい機能やサービスを試すテスト環境も豊かになり、新サービスを素早く実装できる。この好循環が回り出すと後続組は追いつけなくなる」
「製造業は製造技術やノウハウで製品の質を高めてきた。今後はモノづくりのノウハウを持っていても、データがなければ競争に参加できなくなる。対策はいち早く製品を出すことだ。医療画像へのAI応用は米FDAで出てきている。画像認識AIの競争はもう終盤。次は機械系だ」
―データはプライバシー問題があります。AIスピーカーの普及が期待されていますが、データ収集端末になれるかどうか。
「おもてなしとプライバシーは表裏一体だ。旅館や料亭の仲居さんも気を回すために、お客の個人情報を知っているが、お客に信頼されている。プライバシーは日本的な方法で解決したいところだ。半分冗談だが、人の顔をアニメや動物の顔にするだけで人はなごむ。画像認識などAIのアルゴリズムは顔の写真がそのまま必要なわけではない。機械的に抽象化した情報があれば十分だ。マーケティングではデータから個人を特定したいのではなく、振る舞いを予想したいだけだ。商品選びが他の人と似ているか、次にどんな商品を求めるか推定して先回りできればいい。顔や自身が調べられると不快だという感情には、日本なりの
解決策を見つけたい」
良質なデータ集まるビジネスモデルを
―プライバシーをクリアしたとしても、データだけが集まればいいわけではありません。どんな意味を持つデータか、ラベルをつけないとAIが学習できないのでは。
「農業用のデータなら農家にラベルをつけてもらうしかない。SNSで流れているデータは、ユーザーが写真と一緒に状況説明や感想を挙げる。ユーザーが自発的に楽しんで行い、SNSにラベルのついたデータが集まる仕組みだ。これに似た仕組みを現場の専門家と作り上げる必要がある。初めはお金を払ってデータにラベルをつけてもらう必要もあるだろう。データへの投資とは、単にデータを集めるだけでなく、良質なデータが集まるビジネスモデルを構築することでもある」
―専門知識は先進国が有利ですが、簡単なデータ加工は新興国など人件費の低い社会の方が有利ですね。
「最近、エチオピアを訪ねる機会があった。貧しく道路や家はボロボロで、料理もあまり美味しくない。だが服と車はきれいで日本で売られている商品とあまり変わらなかった。これはアジアで安く生産され、世界中に流通しているためだ。衣服や車、食材などデリバー(物流で運べる)できる商品は後進国も先進国もほぼ変わらず、建物や交通インフラ、料理など、デリバーできないモノ、その場で作らねばならない料理や建築物は貧しいままだ。だが、これらもロボットによってデリバーできるようになる。人間がその場で作ってきたのは、目が必要だったからだ。目を持ったロボットが代わりに働けば、世界中、同じ品質の仕事ができる。今後、商品やサービス、インフラも世界中で差がなくなっていく」
「そしてサービスを買いながらデータを提供する社会と、サービスを提供して収集したデータでサービスを改良し、技術開発で利益を上げる社会の二つに分かれるだろう。日本はどちらを選びたいか。サービスを提供する側に回りたければ、商品やサービスで世界からデータを集めるビジネスモデルをつくるしかない。米国や中国は始めていて、商品やサービスが出てきている。日本企業はいままで通り、普通に戦えば普通に負ける。ITで負けてきた歴史を繰り返すだけだ。戦い方を変えなければならない」
―IoTやウェブサービスは各社がデータ独占を競っていて、製造業など既存の産業ではバリューチェーンのデータ化が進んでいます。ただ独占競争というよりは費用対効果を測りかねている印象があります。いまからでも勝てそうな分野は。
「低頻度でデータが出てくる分野だろう。高頻度でデータが得られる分野はちゃんと集めれば良い。低頻度な分野は、勝ちモデルが決まっていない。製品やロボットを通して初めて、データが集められるようになる分野は独占しやすい。ハードウエアが技術的に難しければ他は参入しにくく、リスクをとって先にハードを普及させる戦略もある。いずれにせよ、端から見て勝ちモデルが明確になった段階で勝敗がついているか、参入機会を逃している」
<次のページ、60代が技術を理解できなければ流れてしまう>