市民が育てるAI、コミュニティーとともに進化
市民が育てる人工知能(AI)が広がりつつある。スポーツや自然観察など、コミュニティーでデータを集め、AIに学習させて精度を高め、市民がAIサービスを受け取る市民参加型のAI育成モデルが成功しつつある。背景には、インターネット上で仕事を受発注するクラウドソーシングの技術やサービスインフラが整備され、市民参画のハードルが下がったことがある。コミュニティーとAIが、ともに進化する社会が実現しようとしている。(小寺貴之)
AIはデータを糧に成長する。データが集まるとAIが賢くなり、サービスが向上してよりデータが集まる。そのため米IT業界ではデータの独占競争が起きた。民間企業がデータを集め、AIでサービスを磨き、ユーザーを囲い込む。ユーザーはサービスを享受しつつも、データは吸い上げられる。
そこで市民にデータの主導権を取り戻す取り組みが模索されている。単純に市民がデータの所有権を主張するだけでなく、データ集積とサービス向上の好循環を市民が納得する形で回す必要がある。
先鞭(せんべん)をつけたのは科学コミュニティーだ。自然科学が好きな市民と大学研究者が協力してデータを集め、研究を推進している。
東北大学の大野ゆかり研究員と山形大学の横山潤教授らは市民からマルハナバチの写真を集めて生態分布を調査している。市民がスマートフォンやデジカメで撮影した蜂の写真の、撮影地点と数から分布確率を求めた。
大野研究員は「市民参画によって日本全体の分布調査がかなった」と喜ぶ。
市民から集まった画像データは山形大の研究者が蜂の種類を分類し、整理している。このデータはコミュニティーの財産だ。画像識別AIに学習させ、マルハナバチの種を識別するシステムを開発中だ。
大野研究員は「農林業分野では害虫の画像収集とAIによる種同定の研究が広がっている」と説明する。いずれ、虫にスマホをかざすだけでおもしろ解説が流れる“昆虫図鑑”が実現するかもしれない。
市民の集める身近な昆虫と農林業の専門家が集める益害虫のデータが統合され、コミュニティーに還元されることが望まれる。
こうした連携の背景にはAI技術の進化がある。統計数理研究所の樋口知之所長は「画像やテキスト、音声データの学習はめどが立ち、動画への対応が進む。人間のコミュニケーションのほとんどを扱えるようになる」と説明する。
画像では古文書のくずし文字のデータが集まり、文字認識AIが開発されている。スポーツの動画はフォームやプレーのデータを集めて分類すれば、市民向けのフォーム判定アプリや戦術指南アプリの開発が期待される。
こうした連携のためにはデータ収集のインフラが安価に誰でも使える必要があった。筑波大学の森嶋厚行教授と松原正樹助教らは表計算ソフト「エクセル」感覚でデータ収集やデータ整理を管理できるシステム「クラウドシート」を開発した。ウェブからデータを集めて、一般市民が分類し、難しい判断は専門家の意見を仰ぐなど、多段階のデータ収集・整理の作業を運用できる。市民に作業を割り当て、一斉に取り組むクラウドソーシングがエクセル感覚になる。
松原助教は「クラウドソーシングの最難関は作業設計。クラウドシートではプログラミングのIf・then条件分岐を書ければ、誰でも始められる」と胸を張る。プログラミング教育が浸透すれば、中学生にもデータ収集ができるかもしれない。
理化学研究所革新知能統合研究センターの杉山将センター長は「中高生の部活にプログラミング部やコンピューター部があるように、AI部ができるだろう」と期待する。整理されたデータさえあれば、画像認識AIはオープンソースで手軽に作れてしまう。
さらにAIの苦手分野にコミュニティーの力を活用する研究もある。森嶋教授らはクラウドソーシングで仮説を立てて検証する仕組みを開発した。現在のAIは因果推論は苦手だ。データから相関関係を判定できても因果関係の判定は難しい。
そこでネットを介して一般市民から仮説を募集し、仮説の検証も市民にお願いすることにした。例えば「よく眠るにはどうしたらよいか」と市民に問いかけ、「ホットミルクを寝る前に飲む」などの仮説を多数集める。そして実際にホットミルクを飲んで寝てもらい効果を聞く。四つの仮説をそれぞれ100人が試し、睡眠の臨床研究と同じ結果が得られた。睡眠研究で有効なものはクラウドソーシングでも統計有意に有効だった。
森嶋教授は「クラウドソーシングは数百人規模の実験を数万円で実施できる。臨床研究に比べ安い」という。AI技術で因果を特定できずに寸断されている知識体系も、クラウドソーシングで補完すれば、知識全体を活用できるかもしない。
例えば商店街のゴミ出しルールが守られず、ネズミが増え、野良ネコが増えて、車との衝突事故が増えるなど、連鎖する情報を段階ごとに市民に聞いて確かめられるかもしれない。
市民がAIの学習データを集めたり、AIの苦手分野を補って育てたりすることで、コミュニティーを成長させる社会が実現しつつある。
全国からハチの写真 大学が分布調査
AIはデータを糧に成長する。データが集まるとAIが賢くなり、サービスが向上してよりデータが集まる。そのため米IT業界ではデータの独占競争が起きた。民間企業がデータを集め、AIでサービスを磨き、ユーザーを囲い込む。ユーザーはサービスを享受しつつも、データは吸い上げられる。
そこで市民にデータの主導権を取り戻す取り組みが模索されている。単純に市民がデータの所有権を主張するだけでなく、データ集積とサービス向上の好循環を市民が納得する形で回す必要がある。
先鞭(せんべん)をつけたのは科学コミュニティーだ。自然科学が好きな市民と大学研究者が協力してデータを集め、研究を推進している。
東北大学の大野ゆかり研究員と山形大学の横山潤教授らは市民からマルハナバチの写真を集めて生態分布を調査している。市民がスマートフォンやデジカメで撮影した蜂の写真の、撮影地点と数から分布確率を求めた。
大野研究員は「市民参画によって日本全体の分布調査がかなった」と喜ぶ。
市民から集まった画像データは山形大の研究者が蜂の種類を分類し、整理している。このデータはコミュニティーの財産だ。画像識別AIに学習させ、マルハナバチの種を識別するシステムを開発中だ。
大野研究員は「農林業分野では害虫の画像収集とAIによる種同定の研究が広がっている」と説明する。いずれ、虫にスマホをかざすだけでおもしろ解説が流れる“昆虫図鑑”が実現するかもしれない。
市民の集める身近な昆虫と農林業の専門家が集める益害虫のデータが統合され、コミュニティーに還元されることが望まれる。
クラウドソーシング 「エクセル感覚」に
こうした連携の背景にはAI技術の進化がある。統計数理研究所の樋口知之所長は「画像やテキスト、音声データの学習はめどが立ち、動画への対応が進む。人間のコミュニケーションのほとんどを扱えるようになる」と説明する。
画像では古文書のくずし文字のデータが集まり、文字認識AIが開発されている。スポーツの動画はフォームやプレーのデータを集めて分類すれば、市民向けのフォーム判定アプリや戦術指南アプリの開発が期待される。
こうした連携のためにはデータ収集のインフラが安価に誰でも使える必要があった。筑波大学の森嶋厚行教授と松原正樹助教らは表計算ソフト「エクセル」感覚でデータ収集やデータ整理を管理できるシステム「クラウドシート」を開発した。ウェブからデータを集めて、一般市民が分類し、難しい判断は専門家の意見を仰ぐなど、多段階のデータ収集・整理の作業を運用できる。市民に作業を割り当て、一斉に取り組むクラウドソーシングがエクセル感覚になる。
松原助教は「クラウドソーシングの最難関は作業設計。クラウドシートではプログラミングのIf・then条件分岐を書ければ、誰でも始められる」と胸を張る。プログラミング教育が浸透すれば、中学生にもデータ収集ができるかもしれない。
理化学研究所革新知能統合研究センターの杉山将センター長は「中高生の部活にプログラミング部やコンピューター部があるように、AI部ができるだろう」と期待する。整理されたデータさえあれば、画像認識AIはオープンソースで手軽に作れてしまう。
因果推論克服 仮説を考案・検証、寸断の知識を体系化
さらにAIの苦手分野にコミュニティーの力を活用する研究もある。森嶋教授らはクラウドソーシングで仮説を立てて検証する仕組みを開発した。現在のAIは因果推論は苦手だ。データから相関関係を判定できても因果関係の判定は難しい。
そこでネットを介して一般市民から仮説を募集し、仮説の検証も市民にお願いすることにした。例えば「よく眠るにはどうしたらよいか」と市民に問いかけ、「ホットミルクを寝る前に飲む」などの仮説を多数集める。そして実際にホットミルクを飲んで寝てもらい効果を聞く。四つの仮説をそれぞれ100人が試し、睡眠の臨床研究と同じ結果が得られた。睡眠研究で有効なものはクラウドソーシングでも統計有意に有効だった。
森嶋教授は「クラウドソーシングは数百人規模の実験を数万円で実施できる。臨床研究に比べ安い」という。AI技術で因果を特定できずに寸断されている知識体系も、クラウドソーシングで補完すれば、知識全体を活用できるかもしない。
例えば商店街のゴミ出しルールが守られず、ネズミが増え、野良ネコが増えて、車との衝突事故が増えるなど、連鎖する情報を段階ごとに市民に聞いて確かめられるかもしれない。
市民がAIの学習データを集めたり、AIの苦手分野を補って育てたりすることで、コミュニティーを成長させる社会が実現しつつある。
日刊工業新聞2018年4月30日