ニュース

東芝デジタルソリューションズ、文字認識精度を強化したクラウド型AI-OCRサービス新版

誤読抑制技術を適用し効率のよい訂正作業を実現

 東芝デジタルソリューションズ株式会社は21日、クラウド型OCR「AI OCR文字認識サービス」の新版、文字認識精度を強化した「同 V2.5」を提供開始すると発表した。

 AI OCR文字認識サービスは、50年以上のOCR技術の開発ノウハウとディープラーニング(深層学習)技術を融合させたAI OCRにより、請求書や受発注伝票など、オフィスの紙文書の読み取りを行うサービス。

 今回の新版では、2020年1月にリリースしたV2.0以降の学習手法や学習データの改良に加え、ディープラーニング技術の適用範囲を、文字認識から画像処理に拡大させるなどの技術進化を継続させている。

 その結果、取り消し線や訂正印の読み飛ばし、イメージスキャンの際の画像劣化に対応するなど、実際の運用で目にする帳票に対しても、対象となる文字列をより正確に読み取り可能になったとのこと。また、住所や名前など複数行で記述される書き方にも対応し、いっそう効率よく、データ入力を行えるようにしている。

ディープラーニング技術の拡大による読み取り精度向上(読取可能な文字列)

 さらに、長年のOCR技術開発で培った誤読抑制技術を適用することで、申込書や申請用紙などで広く見られる1枠1文字の書式に対して高い認識精度を実現した、認識過程で誤読の可能性がある個所は「?」で結果を返し、「?」以外の部分の文字認識精度が99.7%を実現しているため、実運用において、認識結果の「?」部分だけを確認・訂正することが可能となり、文字認識から訂正までを効率よく進められるとしている。

誤読抑制OCR技術の仕組み

 さらに、帳票の種類(申請書や届出書など)を自動で識別し仕分けを行う「帳票識別機能」を改良。従来は、多様な帳票が混在した状態から仕分けをすることなく文字認識を行いたい場合、別途専用のWeb画面で帳票識別設定を行った上で文字認識機能を利用する必要があったが、新版では帳票識別機能もAPIで利用できるので、アプリケーションやシステムの柔軟な構成が可能となっている。