ニュース

東芝、1枚の画像を登録するだけで新しい物体を世界最高精度で検出する画像認識AI「Few-shot物体検出AI」を開発

 株式会社東芝は25日、製造現場や流通現場において、取り扱う製品や部品の変更が発生した際でも、新規物体の画像を1枚登録するだけで、即座に世界最高精度で検出する画像認識AI「Few-shot物体検出AI」を開発したと発表した。

 東芝では、画像認識AIは同社グループでもインフラサービスを支える技術として活用が進んでいるが、実際の現場では、AI導入時には存在しなかった新しい物体が登場する場面が多くあり、AIが未学習の物体を新たに追加し、解析対象とすることが求められていると説明。新規物体の検出には、通常はAIの再学習を行うが、現場で、大量の画像・映像と正解情報を用意する必要があることに加え、学習の時間が長くかかるため、頻繁に新規物体が登場するような現場での活用は困難で、一方で再学習が不要な方式(登録型)を採用すると、実用化レベルの検出精度が実現できない課題があるという。

 こうした課題に対して、未学習の物体の画像を1枚用意して登録するだけで、AIの再学習を行うことなく、即座に新規物体の検出を可能にするFew-shot物体検出AIを開発した。

従来の再学習型との学習の違い

 通常、AIは対象となる「正解」が付与された物体以外は「背景」として扱い、画像から対象物体が映る領域を物体候補として抽出する深層モデルを学習する。これに対して、付与された「正解」以外の背景として扱っていた物体を含めて、自動的に学習する新たな方式を開発。さらに、開発した方式で事前に学習した深層モデルを用いることで、従来であれば背景と認識していた部分から自動で抽出される物体候補と、登録した新規物体とを比較し、画像から新規物体を検出するAIを確立した。

「Few-shot物体検出AI」による物体検出

 Few-shot物体検出AIを用いることで、新たに検出したい対象の画像1枚を登録するだけで、即座に検出することが可能になる。深層モデルの再学習を必要としない、登録型の従来方式の検出精度21.2%と比較して、開発したAIでは検出精度が46.0%へと大幅に向上し、再学習不要な登録型において世界最高精度を達成したという。

 東芝では、Few-shot物体検出AIの開発により、これまで導入が見送られていた現場においても、画像認識AIの導入や運用が容易になり、DXの推進に貢献し、多種多様な現場での生産性・品質・作業効率の向上が期待できると説明。今後、技術を早期の社会実装に向けて、2023年度中の製品化を目指し、同社グループの製品およびサービスへ広く活用していくとしている。

従来の登録型との認識精度の違いの例