ニュース

富士通研究所、映像データをAIが認識できる必要最小限のサイズまで圧縮する技術を開発

 株式会社富士通研究所は5日、高精細・大容量な映像データをAIが認識できる必要最小限のサイズまで高圧縮する技術を開発したと発表した。同技術により、映像データを従来の人間による視認を目的とした圧縮技術に比べて10分の1以上圧縮できるとしている。

 映像を解析するAI手法としてはディープラーニングが多用されるが、処理が膨大なため、端末側のエッジサーバーだけで大規模な映像を解析する場合、エッジサーバーの増強などによる計算パワーの確保が必要となる。そのため、クラウドと連携した処理が有効となるが、映像データはサイズが大きいため、ネットワーク帯域が逼迫しないように、全ての映像データを品質を落とさずにクラウドへ送信できる高圧縮技術が求められる。

 今回、富士通研究所が開発した技術は、映像データに映っているヒト・動物・モノなどを認識する際に、判断基準となる特徴において重視する画像の領域がAIと人間では異なることに着目し、AIが重視する領域の自動解析、およびAIが認識できる必要最小限のサイズまでデータを圧縮する。

人間ではなくAIが認識できる画質のイメージ

 圧縮特有の画質劣化が与える認識精度への影響を、画像の領域ごとに解析し、AIの認識結果も踏まえて認識精度に影響しない圧縮率を自動推定する。画像全体の圧縮率を変えて画質を変化させ、その圧縮率を変化させた時の認識結果への影響度を格子状に区切った画像領域ごとに集計することで、AIが認識する過程における特徴の重要度合いを全ての領域ごとに判定する。そして、その各々の領域において認識精度を急激に劣化させる直前の圧縮率を認識精度に影響しない圧縮率として推定する。

 さらに、連続する画像におけるAIの認識結果をフィードバックして、必要最小限まで圧縮率を高める。これらの技術により、AIによる認識精度を維持した状態で画像の高圧縮を実現する。

AIの認識精度を元に圧縮率を推定

 開発した技術を、工場で梱包作業を行っている複数作業員の様子を4Kの高精細カメラで撮影した映像に適用したところ、認識精度が劣化することなくデータサイズを10分の1に削減できることが確認できたという。この技術により、厳密なリアルタイム性が必要でない用途や、さらに、クラウド上に蓄積された複数の映像データ、映像以外のセンサーデータや売り上げなどの実績データなどを組み合わせた高度な映像データの解析などにも活用が期待されるとしている。

 富士通研究所では、開発した技術をさまざまなケースにおいて評価し、さらなる圧縮性能の向上のための研究開発を進め、2020年度中の実用化と、製造業を支えるサービス基盤である富士通株式会社のものづくりデジタルプレイス「FUJITSU Manufacturing Industry Solution COLMINA」をはじめとして、さまざまな業種への展開を目指すとしている。