ニュースイッチ

【東大・松尾先生のディープラーニング講座】なぜ「アルファ碁」は飛躍的に進化した?

画像認識の精度が向上。中でも「生成モデル」がこらから非常に面白い
【東大・松尾先生のディープラーニング講座】なぜ「アルファ碁」は飛躍的に進化した?

松尾豊東大特任准教授


いろいろなやり方で方程式を解く手法が


 ─ディープラーニングではどうやって膨大な数のパラメーターを簡略化するのですか?
 松尾 私が本の中で説明しているのは、“教師なし学習”※2を使うということで、方程式の数自体は少なくてもいいけれど、「この変数間にこういう関係があります」ということがどこかからわかっていれば、変数の数をぐっと減らすことができます。

 人間の場合も、いろいろなデータを観察することで変数間の関係を見つけ出して、実質的な変数の数をぐっと減らすということをやっているのです。よって、その教師なし学習の利用というのが非常に重要なポイントになります。

 ─教師あり学習と教師なし学習を複合するのですね。
 松尾 それ以外にも、先ほど説明したCNNという画像認識では、たとえば画面の中の「ここを見ている処理のしかたと、ここを見ている処理のしかたと、さらに、ここを見ている処理のしかたって、基本的に一緒でしょ」という、そういう仮定を置くんですね。

 視覚の場合、処理の仕方は視野内の位置に依存しないと考えるのはある程度妥当です。そうすると、また変数の数をぐっと減らすことができる。そういういろいろな、「プライヤー」というんですけれども、その前提知識をいかに使って、非常に大きな方程式をいかに効率的に解くかというのが重要なところです。

 実はディープラーニングが階層性をもっているというのも、プライヤーの1つなんですね。要するに「簡単なものの組み合わせで複雑なものができている」という仮定を置いたほうが、その方程式は解きやすくなるということです。

 本当は階層である必要はないんですけれども、階層にしたほうが非常に少ないデータでそういう非常に大きな、たくさんのパラメーターを持った方程式を解きやすいということですね。そういういろいろなやり方で方程式を解く手法が今、どんどん進んできているという、そんな状況ですね。

“知覚”の部分が出てきてロボットに大きな変化


 ─ここ最近でもアプローチの方法は変わってきたのですか?
 松尾 大きく変わったのは2007年ぐらいからです。教師なし学習を使うのが有効だとわかってきて、階層を重ねるとか、ドロップアウトといっていくつかのニューロンを止めてしまうとか、いろいろなやり方をすると、その方程式が上手に解けるということがどんどんわかってきました。

 2007年ぐらいから実はもう、いろいろな方法が試されているんですね。今はとくに画像認識ができるようになったので、今度は「強化学習※3」と組み合わせていろいろな動きが学習できますよとか、先ほどの生成モデルのように「画像が作れますよ」とか、そういう方向にどんどん進化しているという感じですね。

 ─これからディープラーニングはどのような産業に生かされていくのでしょうか?
  ディープラーニングによって“知覚”の部分ができたと考えられますので、ロボット分野にはすごく大きな変化が起こると思います。

 代表的なものとしては、プリファードネットワークスのほか、カリフォルニア大学バークレー校とグーグルの研究などで、ロボットアームがピッキングの動作を自己学習していくという事例が出ています。こういった路線がどんどん進んでくると思います。

 ─バラ積み状態のモノの山から取りやすい順番を学習していくということですか?
 松尾 取りやすい順番だけでなく、どのように取ればいいかも学習できます。最近の例ではロボットアームが実際に取ってみて、「取れた・取れなかった」という試行錯誤を通じて、取り方を学習しています。

 (英グーグル・ディープマインドの)「AlphaGO(アルファ碁)」は一見ロボットと関係なさそうに見えますが、あれも「行為をして、どういう結果が得られたか」という学習の結果として、上手に囲碁を打てるようになるということなので、基本的にはすごく近いテクノロジーなんですよね。

 そう考えると、ロボットアームみたいなものがいろいろ試行錯誤しながら基本的な動作を覚えていって、その組み合わせで非常に難しい動作をするというのも、割とすぐに私はできるようになると思っています。
≪脚注≫※1 教師あり学習
入力データから正しい出力データを得るための関数を作る際、入力とそれに対する正しい出力をペアで与え(訓練データ)、未知の入力に対する出力を正しく予測させようとするもの。
≪脚注≫※2 教師なし学習
教師あり学習と異なり、正しい出力は与えられないため、何らかの基準を設けて、それを最適にするような出力を得ようとするもの。
≪脚注≫※3 強化学習
明示的に正しい出力は与えられず、行動を試してそれに対して得られる「報酬」からどのような行動が良い結果をもたらすのかを学習するアルゴリズム。
 日刊工業新聞社が昨年12月の「2015国際ロボット展」に併せて発刊したロボット情報誌「The ROBOT イノベーション×ビジネス」。6月に出された第2号には人工知能(AI)研究で著名な東京大学の松尾豊特任准教授のインタビューから。

<電子版にて連載中!会員登録でお読みいただけます>

「The ROBOT イノベーション×ビジネス」はこちらからご購入できます
日刊工業新聞2016年7月15日電子版
昆梓紗
昆梓紗 Kon Azusa デジタルメディア局DX編集部 記者
名前はよく聞くけれど実際のところはよくわからない「ディープラーニング」。かなり専門的な内容ではありますが、松尾先生に丁寧に説明していただきました。 「the ROBOT」は第二号も好評発売中です!

編集部のおすすめ