ニュース

TIS、AI-OCR機能を利用した紙資料データ化ソリューション「Paper Searcher」

 TIS株式会社は22日、株式会社Cogent Labsと協業し、同社のAI-OCRエンジン「Tegaki」を活用したソリューションを共同提供すると発表した。第1弾として、「Tegaki」をAI-OCRエンジンに採用した紙資料データ化ソリューション「Paper Searcher」を提供する。

 Paper Searcherは、紙資料のテキストデータ化と検索を可能にする紙資料データ化ソリューション。スキャンした紙資料やPDFをクラウド上のPaper Searcherへアップロードすることにより、資料上の手書き文字をテキストデータ化することができる。

サービス構成イメージ

 特徴は、テキスト領域の自動検知機能を備えている点で、従来のAI-OCR処理では必要だった読み取り領域の事前指定が不要なため、非定型フォーマット書類の電子化を簡単に実現するという。

 また、各種辞書を活用してテキスト化したデータを修正する機能も搭載。業界用語・化学物質名・企業用語など、通常の言語モデルでの補完が難しい用語は、辞書機能に登録することでテキスト化の精度を上げられるとのこと。

 料金は、読み取り帳票の量に応じた従量課金制となり、月額10万円(税別)から。

検索画面イメージ

 TISでは、報告書や議事録など、紙で保管されデジタル化していない書類を持つ企業や、古い紙論文が大量にあり、デジタルデータでの検索が課題となっている大学・研究機関などに向けて、Paper Searcherを展開する考え。

 さらに今後、コージェントラボをはじめとした協業企業とともに、AI-OCRサービスと帳票振分処理、補正処理、データ変換、データ連携といった周辺ソリューションを組み合わせ、業務デジタル化ソリューションとして提供していく予定だ。

 まずは、受信した帳票の種類を正確に分類して振分処理を行い、後続の「Tegaki」に連携する「帳票振分ソリューション」を、2019年春に提供開始する予定。

 それ以外にも、トランザクトのクラウドFAXソリューション「TransFax」と連携して受信したFAXをデジタル化するソリューション、RPAソリューション「UiPath」を用いて申請書を自動デジタル化し、AI-OCRクラウドサービスによりテキスト化されたデータを業務システムへ自動インプットするソリューションなどが例として挙げられている。

サービス構成イメージ