ポーカーでも人間に勝ったAI、いつゲームの世界を飛び出し実社会の問題を解く?

「ポーカーと実社会では不完全性が根本的に違う」

  • 1
  • 2
 人工知能(AI)がゲームを舞台に人間との腕試しを重ねている。囲碁に次いでポーカーでもプロを下すまでに成長した。ゲームで人間と競うのは勝敗やルールが明確な上、大量のデータを集められるためだ。このデータが近年ブレークスルーになったディープラーニング(深層学習)と極めて相性が良い。だがしょせんはゲームとも批判される。AIはいつゲームの世界を飛び出して実社会の問題を解くのだろうか。(小寺貴之)

 米科学誌「サイエンス」にカナダ・アルバータ大学らの研究チームが開発したポーカーAI「ディープスタック」の論文が掲載された。AIが33人のポーカーのプロと対戦し、全体では大幅に勝ち越したという内容だ。

 ポーカーはAIにとって難しい種類のゲームだ。相手の手札が見えず、駆け引きが重要な「不完全情報ゲーム」に分類される。チェスや将棋、囲碁のように相手の手も自分の手も見える完全情報ゲームは計算資源を無限に使えれば最善手を計算できる。

 先手と後手のどちらが勝つか理論的に証明できるゲームだ。だが不完全情報ゲームには一つの正解はなく、計算すべき局面もより複雑だ。今回、カナダの研究チームは深層学習をポーカーに応用した。

 ネットワーク構造の学習器を二つ組み合わせた。それぞれ1000万と100万の訓練データを学習させて性能を高めた。深層学習は膨大なデータを学習できる分野で力を発揮する。囲碁でも米グーグル傘下のディープマインドの「アルファ碁」は3000万局の盤面を学習してトップ棋士を下した。

 囲碁とポーカーに共通するのは局面の多さだ。「ディープスタック」は「テキサスホールデム」というルールのポーカーでプロと対戦した。テキサスホールデムの局面数は10の160乗、囲碁の局面数は10の360乗とされる。ともに人間ではすべての状況を検討できない。プロでも“正解”を説明できず、「感性」や「直感」と表現する。この感覚に頼る領域において、人間の打ってきた手を学習すればAIが人間に勝る。

 ただ実社会で活用するにはAIは人間に勝てば終わりではない。例え人間より間違いが少なくても、ミスが発生するようなら仕事は委ねられない。産業技術総合研究所人工知能研究センターの辻井潤一センター長は、「ポーカーと実社会では不完全性が根本的に違う」と説明する。

 ポーカーは相手の手札の中身こそわからないが、トランプ札数(52枚とジョーカー)の域を出ない。不完全ではありながら計算しうる範囲内に収まる。ところが実社会では例えば疾患と病因など、想定外の因子が関係してくる前提で問題を解く場合では難度が跳ね上がる。麻生英樹副研究センター長も「ポーカーを解くだけでは、実問題をAI単独で解くのは難しい」と声をそろえる。

 そこで注目されるのは実社会の問題をポーカーなみに単純化して切り取る力だ。AIがシミュレーションできるように社会から一定ルールを見いだし、ルールから逸脱する領域との相互関係を示すことにより、人間がAIの答えを解釈できるようにする能力だ。これはAI研究者には難しく各分野の専門家に頼っている。現場との連携が求められている。
(文=小寺貴之)

日刊工業新聞2017年3月30日

COMMENT

実社会の問題を単純化する際に、AIに与えるデータの取り方を合わせて設計する必要があります。サービス系など、人間の振る舞いは単純化が難しく、計測技術もまだまだです。一案としてはカメラの映像からモーションキャプチャーできれば、動きに関するデータがとれます。次に商業施設やスポーツ施設などと状況を限定して、動きと購買欲、動きと健康状態をひも付けていくことになると思います。思考に関するデータはAIが「何を探しているの」と問いかけるのが手っ取り早いです。音声対話は企業間の競争になったので、大学などは声かけのタイミングを決める迷い状態の推定や、思考の内容を限定するための状況推定が狙いどこと思います。コンタクトポイントの取り合い合戦は熾烈なので研究寿命は2-3年かもしれませんが。 (日刊工業新聞科学技術部・小寺貴之)

関連する記事はこちら

特集