ニュース

東芝、骨格認識AIと動画認識AIを組み合わせ、少ない計算量で高精度に人物の行動を認識する「ハイブリッド行動認識AI」を開発

三柳英樹

2024年10月29日 08:30

　株式会社東芝は28日、人物の骨格の動きと1枚の画像を効率的に組み合わせることで、人のさまざまな行動を、少ない計算量で高精度に認識できる「ハイブリッド行動認識AI」を開発したと発表した。

　製造現場では、作業効率の分析や作業ミスの検知・防止を目的として、カメラ映像から作業員の行動を認識する「行動認識AI」の導入が進んでおり、行動認識AIは大きく分けて、撮影した人物の映像を骨格情報に変換し解析する「骨格認識AI」と、カメラで撮影した動画をそのまま解析する「動画認識AI」がある。

　骨格認識AIは、少ない計算量で行動を認識できることから導入が進む一方、人物の持ち物が何なのか判別ができず、認識できる行動の種類に制限があった。一方の動画認識AIは、持ち物も含めて行動を認識できるが、計算量が膨大で高性能な計算用のサーバーを必要とし、運用コストが高くなる課題があったという。

　今回、東芝が開発したハイブリッド行動認識AIは、人物の骨格の動きを参考にしながら、独自のAIアルゴリズムにより、カメラ映像から行動を認識するために最適な画像を1枚だけ抽出する。そして、骨格の動きと、抽出した画像を効率的に組み合わせることで、少ない計算量で、道具を持っている人物の行動を認識できる。

ハイブリッド行動認識AI

　開発したAIでは、骨格の動きを参考に、独自のAIアルゴリズムを用いて、カメラ映像から行動認識に重要なキーフレームとなる画像を1枚だけ抽出する。具体的には、行動認識に必要となる度合いを「注目度」という指標で表し、時系列に並ぶフレームの中から、「注目度」が高いフレームを選択する。この技術により、動画認識AIと骨格認識AIの両者のデメリットを打ち消し合う、ハイブリッド行動認識AIを実現した。

　キーフレームとなる画像のみを利用することで、少ない計算量で、骨格情報には含まれない工具や部品などのビジュアル情報をAIに取り組むことができ、骨格と画像の情報を効率的に計算する行動認識が可能となる。

　東芝が行った、公開データセットを用いた評価では、特に行動認識の結果が持ち物の影響を受けるケースに対して、認識精度が51.6％から89.5％と大幅に向上したことを確認した。

　ハイブリッド行動認識AIにより、骨格認識AIだけでは認識できなかった行動が区別できるようになり、詳細な作業内容や所要時間を実用的な精度で解析できると説明。さらに、動画のフレームをすべて処理する動画認識AIと比較して、ハイブリッド行動認識AIは4.6倍高速に処理できるため、現場への導入が進んでいる骨格認識AIと同様に、リアルタイムでの処理が可能となる。動画認識AIよりも低い計算量で、骨格認識AIより詳細に作業内容を解析できるため、製造現場におけるDXへの寄与が期待されるとしている。

　東芝は今後、ハイブリッド行動認識AIを東芝グループの工場や、東芝ライテック株式会社の製品であるカメラ付きLED照明「ViewLED」を用いた画像解析ソリューションなどに広く活用し、早期の実用化を目指すとしている。