ニュースイッチ

生活支援ロボット、AIで変革した現在地と展望

生活支援ロボット、AIで変革した現在地と展望

プリファードロボティクスの搬送ロボット「カチャカ」

人工知能(AI)技術が生活支援ロボット開発に変革をもたらした。AIシステムの核となる「基盤モデル」の進化で自然な対話やコード生成が可能となり、簡単な指示で一連の動作を自動実行するロボットの実現が見えてきた。開発者の次の関心は基盤モデルのマルチモーダル化だ。三次元(3D)データや力触覚など、多様なデータを統合して高度な認識や理解を可能にする。実現にはお金をかけなくてもデータが集まる基盤作りが重要になる。生活支援ロボットの現在地と展望を探った。(小寺貴之)

動画・3D・力触覚など、データ蓄積に課題

「言葉で説明さえできれば、ロボットを動かせるようになる」―。プリファードロボティクス(東京都千代田区)の渡辺貴史エンジニアは、家庭用搬送ロボット「カチャカ」と大規模言語モデル(LLM)の連携効果をこう説明する。LLMを介することにより、人間の曖昧な指示をロボットに入力できるようになった。

例えば「そろそろお婆ちゃんが帰ってくるから、玄関で荷物を受け取ってあげて」。こんな指示を処理するのは難しかった。まず玄関をロボットの待機位置に設定し、人間が検出されたら、人物検出でお婆ちゃんかどうか判定。移動台車に荷物が置かれたら指定位置に移動し、完了したらそれを伝える。

カチャカが台車(右)を乗せて運ぶ

もし、お婆ちゃんが20分たっても帰ってこなければどうするか、帰ってきた人がお婆ちゃんでなければどうするかなど、一連の動作の判断ポイントを整理しコードを書く必要があった。小さなタスクでもコードが大きくなるため、雑用をすべて人が書き切るのは不可能だった。生活支援ロボットが実用化されない原因の一つだった。

だがLLMで指示の解釈やコード生成が可能になった。渡辺エンジニアは「例外処理を含めて条件分岐を生成する。一度に長いコードを生成できてしまうのがLLMの利点」と説明する。来春の機能実装に向け開発を進めている。

東京大学の大日方慶樹大学院生と河原塚健人特任助教は、ロボットとのチャット式対話システムを開発した。ロボットが毎日数回、部屋の風景を撮影して説明要約文とともにメッセージをユーザーに送る。例えば「テーブルの上に食べ終えた食器が並んでいます」とロボットから通知がきたらユーザーは片付けを指示する。ロボットは人間のようには気が付かないため、普段から対話して仕事のきっかけを作る仕組みだ。

東大のロボット。部屋の風景を撮影して説明文とともにユーザーに送る。ユーザーはそれを基に片付けなどを指示できる

対話力の向上でユーザーの指示が曖昧でも聞き直せば済むようになった。ただ何度も聞くようではユーザーはへきえきしてしまう。例えば食器を片付ける棚はどこか、部屋にある棚一つひとつ写真を送り付けられて照会されるとうんざりする。

そこで慶応義塾大学の兼田寛大大学院生と杉浦孔明教授は、検索のようにランキング形式で画像を提示するシステムを開発した。ユーザーは棚の画像リストから目的の棚を選べば済む。杉浦教授は「ユーザーは1度の指示で仕事が完了することを求める。何度も会話して絞り込むよりは、一覧から選べる検索インターフェースが適している」と説明する。

LLMなどの基盤モデルによって生活支援ロボットは大きく進化した。実用化に向け価格やビジネスモデルなどの課題はあるが、技術的には自然な会話や指示の実現は時間の問題になってきた。

研究室・地域で実地運用模索

こうした中、ロボット研究者が次のテーマとして重視するのが、基盤モデルのマルチモーダル化だ。テキストや画像に加えて、動画や3Dデータ、力触覚などを学習に混ぜてロボットを進化させる取り組みだ。

ロボット研究で使うデータの状況

テキストと画像はインターネット上にある膨大なデータから集められた。動画データは大量にあるものの3Dデータは少なく、力触覚データはほぼない。プリファードネットワークス(同千代田区)の松元叡一リサーチャーは「まずは3Dデータ。3Dでロボットの空間理解が深まる。触覚に関してはテキスト表現と触覚データが対応すればLLMを活用しやすくなる」と指摘する。

同社の西川徹社長は「身体の動きをシミュレーションしたデータをロボットに学習させると、(介護の現場などで)身体構造を理解した作業が可能になる」と説明する。ロボットによる介護支援では、人体の構造を加味して動作を生成しないと関節を無理に曲げるなどのリスクがあった。シミュレーションと力触覚を組み合わせることで優しく身体を支持できるようになる。 

3Dや力触覚のデータを戦略的に集める必要がある。現在は資金力のある米巨大ITが研究をけん引している。ここで重要なのが資金力に依存しないデータ収集の仕組みを作ることだ。

全国の研究室が協力し、データを蓄え活用するモデルが考えられる。例えばトヨタ自動車は生活支援ロボット「HSR」をロボット学会や、ロボット競技会「ロボカップ」の日本委員会を通し大学などに無償貸与してきた。日本で39拠点、欧米を含め67拠点で研究に使われている。

この研究インフラを用い、標準化されたデータを集める仕組みが作れる。玉川大学の稲邑哲也教授は「日本の強みはHSRコミュニティー。活用しない手はない」と指摘する。一方で「大学研究室からデータを集めても量には限界がある」という。授業などで忙しい教員や学生がロボを動かせる時間は長くないためだ。

トヨタが開発中のしなやかな腕の生活支援ロボット

そこで万博など国際イベントを起点に地域でロボットを運用する仕組みが模索されている。東京五輪・パラリンピックではHSRが水の配布やゴミ回収に利用された。地域でロボットを使うことでデータが蓄積され、それを基に研究者が機能を高度化。地域でより使いやすいロボットになるという好循環が望まれる。

現在トヨタはHSRの技術を土台に、しなやかな腕を持つ生活支援ロボットを開発している。ワイヤ駆動でアーム先端を軽くし、人にぶつかっても傷付けにくく、自身も壊れにくい。トヨタ未来創成センターの森健光グループ長は「データを集めやすい機体として設計した」と説明する。

機体と開発コミュニティーはすでにあり、後は連携モデルを描けるかどうかだ。大阪国際工科専門職大学の浅田稔副学長・大阪大学名誉教授は「ロボカップを起点に社会とロボットをつなぐ仕組みを作りたい」と力を込める。資金力がものを言ってきたロボット研究の競争原理を覆せるか注目される。

日刊工業新聞 2023年11月08日
小寺貴之
小寺貴之 Kodera Takayuki 編集局科学技術部 記者
LLMのおかげで人間と機械の対話がかなりスムーズになります。家事のような細かくたくさんあるタスクの調整はエンジニアからユーザーに移管できるようになるかもしれません。当面は無理でも、10年後には社会インフラ化していてもおかしくないように思います。エンジニアはその仕組みを作っています。そうすると、地域振興や科技政策を担う人たちは、そんな社会を作る土壌を作り始めないといけないと思います。徳島県神山町のサテライトオフィス施策のように、小さな単位でロボット前提の暮らしを始めてもいいように思います。人口2000人くらいの地域でロボットを使い倒す。するとロボットをサポートするエンジニアやデータインフラをサポートするキュレーター、そこで実験するロボット研究者、それを研究する社会学研究者、そこでロボットサービスを開発するエンジニア、それを学びに来る視察者の行政ツアーなどなど、いろんな人が集まるかもしれません。神山町を恨めしく思っていた首長さんにはチャンスです。研究学園都市はそうあるべきなのかもしれません。問題はロボット系の基盤モデルはどのくらいのデータがあればうまくいくのか、まだ見えていない点です。テキストと画像だけで、いまの生成AIが必要とするデータと計算量になっています。問題の範囲を広げて複雑になればなるほど、必要なデータや計算資源は大きくなるはずです。言い換えると、場を作ればずっと研究開発が続くことになります。技術はまねできても地域やコミュニティーはそう簡単にはまねできません。こういう競争力の作り方も挑戦してみる価値があると思います。

編集部のおすすめ