# プレディクトロン

グーグル子会社、深層学習より高い予測性能を実現

英ディープマインドが長期課題担うＡＩ開発

2017年06月17日トピックス

　米グーグル傘下の英ディープマインドは、多段階の反応や行動を解く「自動計画」と、さまざまな手法の中から良い手法を見つけさせる「強化学習」を融合した新しい人工知能（ＡＩ）技術「ＰＲＥＤＩＣＴＲＯＮ」（プレディクトロン）を開発した。

　ＡＩが学習しながら長めの計画を立てられる。簡易化したビリヤードでは従来の約３倍となる５０回中、２７回でボールをポケットに落とすなど、既存の深層学習を使う手法より高い予測性能を実現した。

　プレディクトロンでは、自動計画と強化学習を融合し、多段階の各段階で報酬を与えて最適な手法をみつけさせつつ、報酬を累積させるなどして学習が破綻しないようにした。

　簡易型ビリヤードで性能を検証。四つのボールをランダムに配置し、その中の白玉を転がして他のボールをコーナーに落とす。ボールを転がす角度や速度によって壁や別のボールにどう跳ね返り、ボールが転がるかＡＩに予測させる。その結果、５０回中２７回でコーナーに落とせた。従来技術では１０回だった。

　従来のＡＩでは連続的な問題を解く際に、１段階での学習を繰り返していたため、全体としての成功率が上がりづらかった。プレディクトロンでは、多段階で長めの計画を立てられるようになった。