「AIまだまだ使えない」エンジニアが語るAIブームへの違和感と答え
人工知能(AI)の実用性は、現状どれほどのものなのか? 開発に携わる専門家と一般の人とでは、認識が大きく違うようだ。
今回、ウェブサイトやモバイルアプリのデータ分析サービス「KARTE(カルテ)」を提供するプレイド(東京都中央区)の牧野祐己さんと春日瑛さんに、AIの技術的課題やビジネスで展開していく上での運営的な課題、さらにはカルテではどのように課題解決を試みているのかを聞いた。
牧野さんは、「今後5年や10年で広く言われているようにAIが進化して、人や社会に関する色々な問題が解けるようになるかというと、おそらくそうはならない」と話す。AIは、写真に写っているものが何かを判別することや、テキストを読み取って大まかに要約するといった比較的単純な課題に対しては有効だが、現実世界の複雑な問題の解決に利用するにはまだまだ時間を要するという。
記事の内容に関しての前提が三つある。まず、「AI」という言葉の意味や使い分けについて。AIという言葉は現在バズワード化しており、一般的な生活者の多くは映画に出てくるような、人間らしい知能的な処理技術をイメージしている。一方で現在、企業やビジネスシーンでAIと呼ばれるものは、ディープラーニング(深層学習、Deep Learning、以下DL)などの機械学習技術を使ったもの、もしくは単に自動的な処理を指すことが多い。記事では後者をDLや機械学習(Machine Learning、以下ML)などと表現し、前者と後者を含むバズワード化した総称を「AI」としている。二つ目は扱う時間の範囲。AIへの課題感はこの先10年ほどまでを見通したものだ。技術は進歩するので、15年後、20年後はAIがどのように発達しているのかは分からないからだ。三つ目は、GAFA(Google、Apple、Facebook、Amazon)についてだ。GAFAのような巨大IT企業は大量のデータを活用することですでに様々な課題に対応できている例外的な立場だという。(聞き手・平川透)
Q、AIに対し、どのような課題感を抱いていますか?
牧野さん「2007年から09年まで、大学院で機械学習を使って研究をしていた。当時はDLがブームになる少し前。当初は『MLで何でも解ける』ような幻想を抱いたのだが、いざ現実問題で活用してみると『そうでもないな』『限界があるな』と感じた。AIに期待する人は、AIを人間のような汎用的な知能だと受け取り、社会の様々な問題が解ける(ようになる)と考えがちだが、そうでもない。14年頃のブームを通じ、一般の人の期待とAIが実際にできることのギャップがさらに大きくなった」
牧野祐己さん
プレイドCTO。東京大学大学院の研究室では人間行動のモデリングの研究に従事。例えば、空港の航空管制管の思考モデルを作り、どのように行動するかシミュレーションしていた。卒業後IBMで分散データベース、並列プログラミング言語、自然言語処理を用いたテキスト分析の研究開発に従事する。15年にプレイドに入社。
■「答えが分からない」問題
「一般的にAIやMLは、答えが明らかに存在している問題を解くのが得意。例えばIBMのワトソンが、与えられたたくさんのデータに基づいてクイズを解く、みたいな形で課題を解決することは得意。しかし、それをやるにしても、実はものすごく準備時間がいる。大量のデータを集め、答えを導くための学習をさせ、システムをセットアップしなければならない」
「実際の世界では、人って答えが分かっていない問題を解いているように思う。例えば、小売の販売員が接客をする時、お客さんがどんな人なのかは分かっていない。データを使ってお客さんが満足する接客ができると良いのだが、答えが分かっていることを得意とするAIは性能としてはまだまだ」
■「とりあえずAIで」問題
春日さん「大学・大学院では主に統計学の研究していた。MLで一般的に使われているアルゴリズムは、統計的機械学習という技術の延長で、その中のひとつがDL。統計学で問題を考えるとき、実は人が設定した仮説が最初にあり、その上でデータを解析している。強めの仮説を置いた上で、『そのデータには意味があるのか?』『その差ってどんな意味?』と調べていく。MLはその延長のアルゴリズム。となるとやはり人の仮説がある上で使っていて、現実問題を解く上でも仮定が前提として必要。そこがあまり理解されないまま、AIという言葉が独り歩きしてしまうと、的外れな期待になってしまう。昨今のニュースを見ていると『何でもできる』みたいな風潮があるように感じる。ビジネス側とAI開発側のギャップが大きくなっている気がする」
春日瑛さん
東京大学大学院では統計学に基づいたデータマイニングや意思決定支援システムを研究。DeNAを経て19年12月にプレイドに入社。機械学習のプロダクト作りに注力。カルテが取得するユーザーの色々な行動データをもとにUXを向上させるためのアルゴリズムを開発中。
牧野さん「ビジネスの課題からではなく、AI活用からスタートしてしまうことが、ギャップの原因だと思う。『なんだかよく分からないけれどデータを活用するとすごいことができそう』『AIという新しい技術を使わないといけないよね』というところからスタートして実際の活用につなげようとしがち」
Q、AIが現実世界の課題解決にまだまだ向いていない理由は何ですか?
「一つ目はデータが足りないこと。GAFAのように大量で多様なデータを利用できる企業では、色々な問題に立ち向かえるが、一般企業やエンジニア個人は優れたAIアプリを作るための十分なデータを取得できない」
「二つ目は、AIシステムの開発現場と活用現場に距離があること。MLモデルを作ろうとしたとき、モデルを作るエンジニアと活用する人は、仕事が大きく異なっていて、さらには二者の間に様々な人が介している。ビジネスでAIを活用する場合、企画する人がいて、システム構築をする人がいて、システム上にモデルを作る人がいて、モデルを作るためにデータを集める人がいて・・・という風になる。システム完成までには時間がかかるので時間的な距離もある」
■「作ったけど使えなかったね」問題
「さらには、その距離の長さによって、作りたいものと実際に出来上がるものに大きなギャップが生まれてしまう。ひとまずシステムが完成しても、当初の狙いから離れてしまっていることが多い。思ったより使えないアプリになっている。それを修正しようとするとまた多くの人が介する」
春日さん「この問題はシステムを外注する際によく発生する。開発する会社と使いたい会社とでは期待値のギャップが大きいように思う。そこをすり合わせることが難しい。大きな予算でシステムを作ったのに『使えなかったね』となり、PoC(概念実証)の段階で終わってしまったという話はよく見聞きする」
「認識のギャップを埋めるために、ビジネス側もエンジニア側もお互いの理解度がある程度高いことが望ましいが、専門性の違いや組織上の役割分担があり、両者を繋ぐスペシャリストのような存在がいないと進みにくいことが多い」
■「データの流れが切れる」問題
牧野さん「三つ目は、AIと人がインタラクティブではないこと。人は分析された結果を見たときに、『これは違うな』『正しいな』など様々なことを感じて次のアクションをとる。AIも本来的には、分析結果を見た人のフィードバックによってモデルが改善されていくことが『人工的な知能』のように思うが、現実的には、分析結果を見た人がどのようなアクションをとったのかはデータとしては取らない(取れない)ことが多く、インタラクティブではない。例えば、小売業ではデータに基づいて店の陳列を変えてみるということがあるが、どのように陳列を変更したかのデータを取り込むといった、改善アクションのデータを当たり前のように活かすところまで至ってはいない。データとして切れている」
■人とシステムがフィードバックしあうループが望ましい
春日さん「モデルというものは生ものと一緒。放っておくと、どんどん精度が下がる。時系列のデータであればなお顕著。人のフィードバックに基づいてモデルをアップデートしていく仕組みが重要」
牧野さん「MLの利点としては、データから導かれる分析結果に、人の判断のバイアスのようなものがないことが挙げられる。MLは中立的にデータを扱える。バイアスがかかってはいけない領域に人が関わるのではなく、それ以外の部分で人がフィードバックを行う。そういうループが望ましい」
■プレイドの狙い、カルテの特徴
カルテとは、プレイドが15年より提供しているウェブサイトやアプリのデータからユーザーを可視化し、近年多くの企業が注力するデジタルのCX(顧客体験)向上に向けた企業活動を支援するサービスだ。従来の集計合算的な分析ツールと大きく違うのは、サイト訪問者一人ひとりのリアルタイムな行動分析にフォーカスしている点。さらに、活用者はデータや学習したモデルによる予測をもとに、個別的なアプローチをしたりUI変更などの様々な改善施策を即時的に実行できる。
Q、プレイドではAIを取り巻く課題をどのように解決しようとしていますか?
牧野さん「まずデータが足りないという問題については、自社サービスを多くの企業のウェブサイトやアプリで利用いただくことでカバーしている。EC、不動産、金融、人材、旅行と、様々なサービスから多様なユーザーの行動データが集まる状態を作った。カルテは今、年間1兆円を超えるユーザーの購買データを解析しているが、集めているデータはそれだけでなく、サイト来訪者の全ての行動。何回目の訪問か、どのようにサイトを遷移したか、どのあたりを見ているか、何を買ったか、など多種多様」
「最初にMLのスマートな仕組みがあるというよりは、データが集まる仕組みやスマートな仕組みがなくてもまわる構造を作った。様々な会社に入れてもらい、データがたまる仕組みを構築した」
■システム開発で重要なこととは?
「システムを活用する人と開発する人が遠いという課題については、クラウドやSaaS(ソフトウェア・アズ・ア・サービス)の活用がひとつの解だと思う。企業は部署単位など小さく導入することが可能で、使い勝手などに対するフィードバックをどんどん伝えられるし、技術の発展や法令の改正などにも対応して進化していく。それらシステムを活用し作業を外出しすることで、例えば、インフラのセットアップのようなどこにでも共通に見られるような作業工程を最小限にし、生産性を高める作業に頭を集中させることが重要だ」
「システム開発で重要なのは、時間をかけ、すごい仕組みを作ることではなくて、とりあえずやってみて結果を知って、改善するというサイクルをうまくまわすことだと考えている。これは一般的なサイトやアプリの開発にも言えることで、カルテを活用すると、そのサイクルを小さく速くまわせる」
■機械学習はあくまでも道具である
「モデルの精度が改善したとしても、現実問題としては重要じゃないケースは多い。それよりも、モデルをどのように使うかに大きなバリューの差がうまれるので、すごく高い精度のモデルを作るというよりは、モデルを問題に適用してみてどうなるかというのを見て、もし本当に重要な使い方ができていれば精度を上げていくという考え方が重要だと思う」
春日さん「前職ではAI研究開発エンジニアとして主にモデル作りに従事してきたが、あるとき、1、2%のモデルの精度を上げる行為と、顧客満足度の向上に乖離があると気がついた。『技術的にはすごく面白いが、価値提供につながっているのか?』と考えていくと、モデルの研究開発だけが大事なのではなくて、モデルの活用の仕方が大事なのだと気がついた。MLといっても、ただの道具。用いる手法はすごく簡単な統計モデルでもよいし、DL的なアプローチでもよい。何を使うにせよ、ライフサイクル的に常にフィードバックができ、人の役に立つようなエコシステムがサービス作りの根幹にある」
■浮かんだアイデアをすぐに試せる
牧野さん「AIの利点に人の判断のバイアスがかからないことを挙げたが、実際のビジネスには人の判断や直感、経験則が有効な部分もたくさんあって、そこから生まれる発想やアイデアを、サイトやアプリでも実行しやすい環境をカルテで作っている。直感で思いついたことを実際やってみると、失敗だったというのも大事なデータだ」
春日さん「顧客にあまり使われなかったというデータや、求めていることとギャップがあった場合に生じた行動データなども取れるので、顧客にフィードバックしやすい。データが切れることなく、インタラクティブな世界観になっている」
■人のアイデアを活かす領域は大きい
牧野さん「ゆくゆくは、開発者がビジネスのことを深く理解できるようになったり、逆にビジネス側の人がAIと呼ばれるものの実際の中身の技術を深く理解し活用できたりするといった、みんながよりジェネラルな活躍ができるようにしていくことが、人の力を最大化するひとつの方法だと考えている。そのようなアプローチも含めて、データを使い人の力を最大化するようなプラットフォームを目指している」
「我々が最近用いるフレーズに、『Human-in-the-loop(ヒューマン イン ザ ループ) 』がある。MLと言えば、人が関係せずにシステムがどんどん賢くなるイメージがあり、未来であれば有効なシステムになっていくと思うがまだまだ途上。人がアイデアを活かす領域は依然として大きい。なので、AIシステムの中に人が介在しフィードバックするループを作ることで、現実世界の問題に取り組むシステムを目指している」(終)
株式会社プレイド https://plaid.co.jp/