多様な見た目を高精度認識、パナソニックHDが開発した画像AI技術の仕組み
パナソニックホールディングス(HD)は電車や鳥など、種類や撮影条件によって見た目が異なる同一カテゴリーの画像を高精度に認識できる人工知能(AI)技術を開発した。自動車やロボティクス、製造現場など高度な画像理解が必要な現場での活用が期待される。
画像認識AIは、画像中の物体の特徴を捉えてカテゴリーを分類することで物体の認識を実現する。一方、例えば「犬」のカテゴリーに属しても、「犬種」などのサブカテゴリー間で見た目が大きく異なる例も少なくない。従来のAIの深層学習は同一カテゴリーに共通する特徴を見つけようとするが、同一カテゴリー内に見え方が異なる細かいカテゴリーが存在する場合、認識精度が低下する課題があった。
パナソニックHDが開発した技術では、さまざまな見た目の特徴を連続的に捉える分類を導入。実証実験では、鳥のように多様な見た目を持つ画像で同一カテゴリーに分類する特徴量を得られた。また、バスと路面電車のように、見た目の特徴が近い画像の識別も実現した。
開発したアルゴリズム(計算手順)を一般的な深層学習の画像認識モデルに追加しても、メモリー量の増加は約0・1%に抑えられる。少ない負荷で精度向上が期待できる。
【関連技術】 パナソニックも注目する元白熱電球メーカーの変身ぶり
日刊工業新聞 2023年12月29日