AI・ロボも迷う…“我が家の冷蔵庫問題”が解けたら値千金な理由
人工知能(AI)技術の大規模言語モデル(LLM)や視覚言語モデル(VLM)など、巨大な基盤モデルを駆使したロボット研究が進んでいる。課題はあるものの、対話やコード生成が技術的に解かれるのは時間の問題と目される。この刈り取りは着実に進めるとして、ロボット研究者は次の10年でどんな研究をすべきか模索が始まっている。身近な課題として“我が家の冷蔵庫問題”がある。極めて高度で解けたら値千金だ。(小寺貴之)
「AIの適用が認識から動作計画に広がった。制御に用いる研究も進んでいる」と東京大学の河原塚健人特任助教は説明する。画像で物体を認識するだけでなく、マップ生成や報酬生成などで抽象的な状況認識が可能になりつつある。そこから「ぬいぐるみを片付けるなら、子ども部屋のオモチャ箱」などと、LLMに含まれる常識を使った行動計画やシミュレーションデータを学習させたアーム制御など、AIの適用が広がっている。
ロボット研究者にとってブレークスルーであると同時に「ロボット向けの基盤モデル構築の知見を持つ機関はごく一部」(東大松嶋達也特任研究員)という課題がある。基盤モデルを応用する研究を進めつつ、次のロボット研究とは何か模索が始まっている。
ここで“我が家の冷蔵庫問題”があらためて注目されている。一般家庭の冷蔵庫は多様な食品が限界まで詰め込まれている。例えば「プリン取って。お父さんの食べかけヨーグルトの後ろにあるから」というタスクでは、食べかけのヨーグルトの認識、後ろに隠れた物体配置の推定、避ける動作の計画、それでも見つからなかった時のリカバリーなど、認識や計画、制御の一連の機能の統合が求められる。慶応義塾大学の杉浦孔明教授は「隠れた物など、見えていない物体は認識できない。今後10年で解かれる課題」と指摘する。
冷凍庫に至ってはピロー包装の側面や袋とじ面が向く形で緻密に詰め込まれている。視点を変えても商品の正面は見えないため画像認識は困難だ。ピロー包装を破らないように取り出し戻す力制御も必要になる。東大の河原塚特任助教は「AIの問題ではない。ハードウエアが追いついていない」と指摘する。
トヨタ自動車未来創成センターの森健光グループ長は「冷蔵庫は衣食住の食のキーパーツ。生活支援ロボにとって切り離せない」と指摘する。その上で「冷蔵庫問題が解けるなら工場のバラ積みピッキングは簡単。要素技術は産業応用されるだろう」と説明する。
基盤モデルでロボットの課題の小さくない領域は解かれるが、ハードウエアやセンサーなどの原点に立ち返ると解けない問題は山ほどある。そして力触覚データなどを混ぜて基盤モデルに学習させると柔らかな制御が実現されるかもしれない。同時に基盤モデルが生成するコードの品質管理や計算コストなど、新たな課題も生まれている。AIの進展を踏まえたロボットの再設計が求められている。