情報学の研究所が見たAI実用化の今

国立情報学研究所・喜連川優所長に聞く

 国立情報学研究所(NII)は大学共同利用機関として超高速通信網など、全国の大学や研究機関の情報基盤を支えてきた。人工知能(AI)によって通信網を流れるデータの活用が注目されている。喜連川優所長に展望を聞いた。

 -日本で人工知能(AI)研究が本格化して約3年がたち、急造した研究機関も落ち着きました。一方、早くも社会実装が求められています。NIIは最近のITの発展の中で、どんな戦略を描きますか。
 「研究から製品化までの時間は、どんどん短くなっている。昨今は、3年あれば社会実装はITの世界では当たり前かもしれない。ディープラーニング(深層学習)は既に幅広く展開されている。重要なことは、システムを構築するために、実はAIという技術だけではなく幅広く多様なIT技術を駆使する必要がある点だ。つまりITの総合力が必須になる。IT系最大の情報処理学会の専門分野は40にも上る。AIはその一つに過ぎず、多くの技術がある。NIIは情報学分野の幅広い研究者を抱える。この力をフル活用して社会実装を推進する」

 -総合力が必要な具体例は。
 「日本医療研究開発機構(AMED)から支援を受けているAIの医療画像ビッグデータ解析がある。日本では胃カメラと大腸カメラが年間1600万件以上実施されており、医学研究者が『これだけデータが整備されている国は他にない』と誇るほどだ。NIIは日本消化器内視鏡学会と連携して内視鏡画像データを集め、疾患を識別するAIを開発した」
 
 「AIを賢くするには膨大なデータが必要になる。データを収集するセキュアなネットワークが不可欠となる。NIIは年7月から国立大学のセキュリティー監視を始め、高度なサイバーセキュリティー技術をもつ。同時に毎秒100ギガビットの最高速ネットワークを運用している。クラウド技術についても大学向けガイドラインを発行している。システムの構築時には、これらの多様な技術の融合が重要であり、NIIの総合力が強みになる」

 -オールジャパンの推進体制も必要です。
 「医療画像は、一つの病院との共同研究ではなく、学会を通して全国の多くの病院からのデータを集めている。AIによる画像解析の研究者も情報研に限らず東京大学、名古屋大学、九州大学から参画しており、今後も招く予定だ。学会は日本病理学会、日本医学放射線学会、日本眼科学会と連携を進めている」

 -実用化は。
 「既に限定された領域では高い精度が達成されつつある。産業への展開はAMEDと学会、医師、患者など関係者と慎重に協議する。この研究成果は、データにラベルをつけるという医師による膨大な作業に支えられている。深層学習を工夫するIT研究者だけで実現されるものではない。論文には、アノテーションに協力して頂いた方々の名前も含めるのはどうかと考えている。高エネルギー物理学では著者の数は1000人、2000人というのが当たり前だ。多数のステークホルダーが協力することで成り立つ事業で開発された技術を、どのように民間企業に技術移転するか。誰も違和感を持たない形にすべく、丁寧な議論を始める」

 -他の分野での取り組みは。
 「別の例としては農業がある。例えばドローンなどを使いデータを集め、画像解析すること日本だけではなく世界中で試みられている。作物の環境への耐性、病害虫への耐性に関するビッグデータは農業を大きく変容させるだろう。農学の研究データは昔からかなり多くあり、若手の研究者が挑戦している。大豆に関して大昔の紙のデータをデジタル化することから始め、ゲノムまでつなげつつある」
 
 -オープンサイエンスもデータ共有が課題です。
 「NIIではオープンサイエンスのための研究データのプラットフォーム開発を進めている。公的資金を受けた研究から得られたデータは保存し、他の研究者にも自由に利用可能にするという発想だ。ただ、どこにデータを集めるか、データのフォーマットは、データ化すべき情報は何か、オープンとクローズの線引きをどうするか、などと議論を始めると際限がない。NIIは、まずソフトウエアを作り、実際に複数の機関に試してもらい、課題を明確にしようとしている。同時に海外から参照できないと意味がないため、試作の段階から欧米などとグローバルな協調も進める」

 -試作の反響は。
 「今までにないシステムを作るため、手探りで多数のソフトウエアコンポーネントを開発中だ。研究者と一緒に試行錯誤し、好評を得ている。例えばオープンサイエンスでは科学論文を発表する際に、論文だけでなくその裏付けとなる実験データをしっかりと管理し、公開することが求められる。多くの場合、論文の掲載日から一定期間が経過した時点でデータをオープンにする。大きな研究機関では年間1000本以上論文を出しており、ジャーナルごとに取り扱いを変えるのはとても煩雑だ。この作業の自動化は喜ばれる。細かな工夫点だが研究者の負担を軽減することは重要だ」

 -公的機関が強い分野は病院や研究などに限られます。公共のデータだけでは限界がありませんか。
 「公共が持つデータと民間の持つデータをどう融合させていくかが重要なトレンドになる。材料開発では公的研究機関が大学を中心とした実験データベースを整え、企業が自社のデータを持ち込み大規模に解析することが考えられる。セキュアな解析環境を実現する技術が必要だ。対して天文学などは、すぐにビジネスとつながらない。科学と産業の距離など、分野に応じて連携やシステムは変わるだろう」

 -データを社会の推進力とするために必要なことは。
 「これまでは、いまあるデータをターゲットとして、分析して何か価値が出せないかという案件が多かった。こうした分野はだいぶ方向が見えてきた。これからはデータのなかった分野で、どのようにキーとなるデータを集めるか考える時代になる。つまりデータデザインのフェーズに入ると考えている」

 「米国でインターネットが登場した際、情報ハイウエーと表現された。情報が行き交う高速道路網ができた。現在は、通信だけではなく、ハイウエーの上でビッグデータが収集され、加工され、蓄えられ、分析され、価値が生み出される。日本を元気にする新しい事業が生まれるようにしなくてはならない。そのためには大学と企業が機動的に連携できる、オンデマンド型のデータプラットフォームが必須だ。NIIの総合力を発揮し、構築していきたい」
(聞き手=小寺貴之)

日刊工業新聞2018年5月24日

小寺 貴之

小寺 貴之
05月26日
この記事のファシリテーター

AIの精度を上げるために多くの関係者からデータを集めると、利害調整が難しくなり実用化が遠のくというジレンマがある。技術開発だけでなく合意形成や法制度との整合が必要だ。これをシステム設計時に組み込まないと、集めたデータが死蔵されることも。情報学研は情報法などの文系研究者を抱える。民間にとって社会実装のパートナーになるだろう。

この記事にコメントする

古川 英光
古川 英光
05月26日
システム構築には総合力が必要。「重要なことは、システムを構築するために、実はAIという技術だけではなく幅広く多様なIT技術を駆使する必要がある点だ。つまりITの総合力が必須になる」
  

ファシリテーター紹介

記者・ファシリテーターへのメッセージ

この記事に関するご意見、ご感想
情報などをお寄せください。