ニュースイッチ

どうする?AIデータの利益配分、妥当性検証の技術開発が急務

人工知能(AI)の学習に必要なデータが膨大になり、データ提供者との権利処理が課題になっている。特に画像生成などの生成系AIには無断で集められたデータが多分に含まれる。許諾を得たデータであってもAIから得られる収益配分の妥当性を検証する技術が必要だ。国が整える規制や制度の実効性を裏付ける技術基盤となるだけに、開発が急がれる。(小寺貴之)

「1万人の作品を学習させたAIは、1万人が創作に参加した作品として評価されるべきだ。必然的に安売りはできないはず」と、クリエーターとAIの未来を考える会の木目百二理事は強調する。現在イラスト生成で社会問題になっているAIモデルは数十億データを学習させて作成したとされている。仮に1万人のクリエーターが1人当たり1万点の作品を許諾して提供し1億データで構築したAIモデルの売上高が年間10億円、利益率が4割だったと仮定する。この利益をデータ量で等分すると最大でも1人当たり4万円の配分になる。これではクリエーターは暮らしていけない。

そこで生成ごとに貢献したデータの提供者に重点分配することが考えられている。電通の児玉拓也AIMIRAI統括は「データの寄与度を測ることになるだろう」と指摘する。そもそも学習データの大部分は創造性のないデータだ。例えばネコというテキストと猫の画像を対応させるための、いわばAIに常識を教えるためのデータに相当する。こうしたデータへの配分をクリエーターが許容できるかどうか不透明だ。許容すれば、常識教示データを機械的に集めたAI開発者の配分が大きくなる。

仮に創造的表現への貢献度で配分を調整する場合、そもそも創造性は技術的に計量できるのかという問題にぶつかる。単純に生成物に最も似ていたデータに分配すると、生成されやすそうなデータを提供するほど配分が増えることになる。創造的表現への貢献度が創造性ではない要素で決まれば、クリエーターから創造性が失われるリスクさえある。国立情報学研究所の越前功教授は「巨大なモデルの生成結果への個々のデータの貢献量を可視化するのは困難。解決にはまだ時間がかかる」と説明する。

そこでユーザーが生成時に例示として用いた画像データが候補に上がる。例示画像を生成系AIに入力し、それを元に画像を出力するタイプのAIだ。こうした例示データはプラットフォーム側がユーザーに提示するランキングアルゴリズムで採用されやすさが決まる。クリエーターから作品を集める必要があるサービスの立ち上げ期は提供者の作品を上位に上げ、AIが育ったらプラットフォーム側が用意したデータを上位に置いて支払いを抑える。創造性とは離れたところで収益配分を調整する仕組みは作れてしまう。

日本としては客観的に検証するための知見や技術が必要だ。なぜならクリエーターの立場は弱く、事業化については海外のプラットフォーマーが先行している状況だ。検証する術がなければ国内のクリエーターやコンテンツ産業を守ることはできない。

こうしたプラットフォーマーとクリエーターの抱える課題は、研究者にとっては魅力的な研究テーマになる。求められる技術は高度で、社会からのニーズは明確だ。そして技術開発だけでなく、人文社会科学の知見と合わせて新しい学術分野を切り開くことになる。この問題は世界規模だ。分野横断で取り組めるかが問われている。

関連記事:創作品の価値損なう…AIとクリエーター、急がれる著作権対応

日刊工業新聞 2023年07月19日
小寺貴之
小寺貴之 Kodera Takayuki 編集局科学技術部 記者
クリエーターにとってはスキルがハッキングされていると言えます。スキルを磨く努力や作品を作る労力が10年後には評価されなくなるだろうと予想されれば、若手は集まらなくなります。志望者が減り、人手不足で自動化技術に頼る。産業界では幅広く観察されてきました。製造業では多くの匠の技が自動化技術で市場価値を失いました。それでも製造業の職人は技術者とともに自らの技を自動化したし、それが会社の競争力となって還元されました。いまクリエーターの多くは雇用されていないので利益配分の仕組みが機能しないと還元はありません。そのため人より先にAIを使って先行者利益を狙う戦略しか選べないでいます。今後、十数年間は同じ問題が幅広い分野で生じると思います。労働や社会、経済の研究者にとって努力への対価がどう変遷するのか。非常に興味深いテーマだと思います。国として知見を蓄えておかないと20年後に何が失われたのかさえ把握できないように思えます。

編集部のおすすめ