ニュース

富士通、人の歩き方の映像を元に人物を高精度に照合できる新技術を開発

 富士通は22日、顔などの情報が写っていない映像からでも、人の歩き方(以下、歩容)を元に人物を高精度に照合できる、歩容照合技術を開発したと発表した。

 開発した技術は、人の関節点の座標から姿勢を推定する汎用深層学習モデルと、汎用的に照合可能な空間への変換により、人物を照合しやすくする富士通の独自技術を組み合わせることで、顔などの情報を必要とせずに高精度に人物を照合可能とする。

 AIを活用した映像解析により、カメラ映像から顔や全身などの特徴に基づき、特定の人物を効率良く照合する技術開発が進んでいる。中でも、顔や服装といった特徴が視認できないような映像でも、人の歩容の特徴をもとに人物照合可能な技術の活用が期待されているが、照合時に使用するカメラに映る人のサイズや歩く位置などのデータが学習時と異なると、照合精度が低下してしまうという課題があった。

 また、より多くの映像データをモデルに再学習させることで、この課題を改善できるが、カメラ映像に映る人のサイズや歩く位置などすべての条件を網羅した再学習は困難で、実用化に向けた大きな障壁となっていたという。

 こうした課題に対し、富士通では照合時に使用するカメラ映像内の人のサイズや歩く位置などの条件が、学習時の映像データと異なる条件であっても正確に照合を可能にする、汎用的に適用可能な深層学習モデルを開発した。

 技術は、事前に取得した人物映像から得られる歩容情報の登録時と、新たに用意した人物映像を入力する照合時の2段階で構成される。

 登録時は、人の複雑な行動を認識する富士通のAI技術「行動分析技術 Actlyzer」の姿勢推定技術を用いて、人の関節点の移動における時系列情報を抽出する。得られた関節点の時系列情報は、人のサイズや歩く位置などの条件がさまざまであることから、それらをサイズや位置によらず汎用的に照合可能な空間に投影して、関節点情報を変換する。さらに、変換された時系列の関節点情報から、カメラ映像内の人物特有の歩容の情報である歩容特徴量を抽出し、歩容特徴量データベースに登録する。

 照合時は、新たに入力された人物映像に対して、登録時と同様に、汎用的に照合可能な空間に投影して変換された関節点情報から歩容特徴量を抽出する。あらかじめ登録した人物映像の歩容特徴量と、新たに入力された人物映像の歩容特徴量との類似度を比較することで、人物を照合する。

開発した技術による人物照合イメージ

 技術の開発にあって、富士通では社内外の最先端テクノロジーを実践・体験する「Fujitsu Uvance Kawasaki Tower」において、2021年10月から12月末まで約1700人を対象に、収集した複数のカメラ映像(ゲート通過、廊下移動など)から作成した大規模なデータセットで開発技術を評価した。その結果、カメラ映像に映る人のサイズや歩く位置が異なるといった場合、これまでの技術では50%未満の精度だったが、開発した技術では約90%の高い精度で人物を照合できたという。

 富士通では、今回開発した技術について、人々が安心安全に暮らすことのできる街の実現に貢献するため、迷子や高齢者の捜索などさまざまな場面で活用できるよう実証に取り組み、2023年度までの実用化を目指すとしている。