ニュース
パナソニック、複雑な背景内文字や特殊文字を検出・認識できるOCRソフトウェア開発キット
画像内文字の翻訳や製品・梱包の印字不良チェックなどに利用可能
2020年1月30日 11:51
パナソニック ソリューションテクノロジー株式会社(以下、パナソニック)は30日、組み込み用OCRソフトウェア開発キット(SDK)「カラーOCRライブラリー」のラインアップとして、カメラ画像などの複雑な背景内文字や特殊文字の検出・認識を実現する「情景内文字認識ライブラリー」を、3月末より提供すると発表した。
「情景内文字認識ライブラリー」は、従来のOCR技術では正確に認識することが困難だった、カメラ画像などの複雑な背景と一体化している文字や、白抜き文字・飾り文字などの特殊な文字(情景内文字)を検出・認識して、文字コードに変換する開発ツールキット。文字の検出と認識を行う2つのAIエンジンを組み合わせ、パナソニックが持つAI画像認識ノウハウをもとに効果的な学習を実施したことで、高い精度での文字検出・認識を実現しているという。
これにより、背景と一体化している文字や、白抜き文字など、これまではテキスト化が難しかった文字認識に対応可能。また用途に応じ、最適なAIモデル追加学習などを行うことで、さらなる認識精度の向上に対応するとした。
なお、製品はSDKとして提供されるので、ユーザー企業のシステムやソフトウェア、サービスに組み込み、業務用途にあわせて利用できる。パナソニックでは、訪日・在留外国人向けの多言語翻訳サービスへ組み込み、ポスターや観光地看板、商品名メニュー画像内文字の翻訳を行ったり、検査システムと組み合わせ、生産工程や出荷検査において製品・梱包の印字不良チェックに利用したり、といった用途に活用できるとアピールしている。