ニュース

東芝デジタルソリューションズ、非定型文書から必要な項目を探し出して読み取る文字認識サービスを提供

 東芝デジタルソリューションズ株式会社は31日、業務効率を大善する文字認識サービスについて、読み取り位置を事前に設定しなくても、受発注伝票や見積書などさまざまな書式・レイアウトの非定型文書から必要な項目を探し出して読み取る機能など、機能強化版の販売を開始した。

 機能強化版の文字認識サービスでは、専用のスキャナが不要で、オフィスの複合機などで作成した紙文書のイメージデータから、簡単な操作で必要な文字を認識することが可能。面倒な読み取り位置の詳細定義は不要で、キーワード(読み取りたい項目)を登録するだけで該当する項目を探して活字を読み取るため、さまざまな書式の非定型文書で利用できる。

 特に「請求書」については、合計金額や請求番号などの主なキーワードが事前登録(プリセット)されているため、すぐに利用でき、「合計金額/総合計/御合計」といった言葉の「ゆらぎ」にも対応する。

 定型文書にも対応しており、読み取り位置をマウス操作で簡単に設定でき、活字だけでなく手書きの読み取りも可能。複数の文書をまとめて処理する一括読み取りや、読取後のチェック・訂正の利便性も強化。利用形態も、クラウドサービス、オンプレミス、APIが選択可能となる(オンプレミスは今後提供予定)。

項目サーチ機能(非定型文書から該当項目を探し出して活字を読み取り)