AI技術抜本強化へ、文科省が予算要求に盛り込む3つの新事業の中身
文部科学省は人工知能(AI)技術の抜本的強化のため、生成系AIの開発強化と人材育成に139億円を投じる。2024年度の概算要求に三つの新規事業を盛り込む。フェイクの生成防止などAIの信頼性を確保し社会的要請に応える研究と、AIで科学研究を加速するための技術開発、異分野を巻き込んだAI人材育成に取り組む。集中投資と普及策を組み合わせて政策効果を高める。
「社会のためのAI研究」「科学のためのAI開発」「AI人材育成」の三つの施策を連動させる。それぞれ30億円と85億円、25億円を新規事業として盛り込む。社会のためのAI研究では生成系AIの原理解明を通して透明性を高める。既存の海外製AIモデルは学習させたデータやモデルがブラックボックスになっている。日本で学習データを準備し入出力を比較すれば、どんな場合に誤った情報を生成するか把握できる。
また学習時に毒となるデータを混入する攻撃への対策や、情報は正しくとも不適切な回答生成を防ぐ技術を開発する。これらは公募で研究計画を募る方針だ。AI研究者は24年度に向けて技術課題を整理し、応募用の実績を作ることになる。AIの信頼性を高め、社会に受け入れられる素地を作る。
科学のためのAI開発では研究開発そのものの革新を狙う。生命科学や物質科学などのデータをAIに学習させて科学用の基盤モデルを構築する。従来はたんぱく質の構造推定などのシミュレーションを走らせ、そのデータを学習させていた。シミュレーションの一部をAIに置き換えて高速化する。機能は変わらなかった。
新事業では、さまざまなデータを学習させ複数の用途に転用できる基盤となるモデルを作る。学習させるデータが波形や画像、テキストなどと種類が増えるため、異なるデータをうまく学習させる仕組みが必要になる。
これは理化学研究所の新事業として85億円を計上する予定だ。理研の量子コンピューティング技術を多分野展開するTRIP事業と併走させて相乗効果を狙う。重要なのは産学連携だ。研究のボトルネックは分野によって異なるため、基盤モデルのユーザーと開発を進める必要がある。
まずは理研の生命科学や物質科学など研究者が各分野でひな型を作る。だが産業に展開する際に企業のデータと整合性がないと基盤モデルの転用でつまずく。データの整備には時間もコストもかかるため、産学での知見共有は欠かせない。
生成系AIを日本の競争力につなげるには多分野の研究者の連携が必須だ。そこで人材育成事業では情報系に限らず生命や材料、経済、社会など多分野の若手や大学院生に研究費や人件費を支給し、AIへの参入や融合研究への挑戦を促す。
若手としては新しい領域を開拓するため、すでに確立された研究の道に進むよりもリスクは高い。挑戦をいとわない人材を求めることになる。概算要求の25億円が満額で承認されれば、1人に1000万円を支給しても200人以上を支援できる。制度設計はこれからだがこの分野の人材は引く手あまただ。国の施策で民間に見劣りしない条件を提示できるかが焦点になる。
生成系AIをめぐっては22年度の末に自由民主党のプロジェクトチームが抜本的強化の必要性を訴え、政府が動き出した経緯がある。今夏の概算要求に向けて各省でプロジェクトが組成され、政策としてまとまってきた。今冬には補正予算が組成され前倒しになると予想される。その筆頭は研究開発に必要な設備関係だ。ただAIフェイク対策など、社会にとっての喫緊の課題が多く、提唱から開始まで1年も待っていられない事情もある。研究者は前倒しで準備する必要がありそうだ。