ニュース

ウイングアークの文書データ活用製品「SPA 10.1」 深層学習を利用したOCRエンジンを提供

読み取ったデータの修正を行いやすい新インターフェイスも

 ウイングアーク1st株式会社は28日、OCRと文書管理の機能を統合して提供する文書データ活用ソリューション「SPA」において、新版「同 Ver.10.1」を同日より販売開始すると発表した。

 SPAは、OCRと文書管理の機能を統合した文書データ活用ソリューション。紙の書類をデータ化することにより、文書を検索して素早く入手できるのみならず、BIツールを使ったデータの可視化や、ETLツール/RPAツールとの連携も可能になるため、データの活用を支援できるとした。

 今回の新版では、従来提供してきた3種類のOCRエンジンに加え、手書き文字のテキストデータ化クラウドサービス「DEEP READ」(株式会社EduLab)を標準機能として提供する。深層学習(ディープラーニング)に基づくAIを活用した文字認識技術を特徴としており、さまざまな業界の3万件のデータをもとに、高い読み取り精度を実現しているという。

 標準では年間30万画像の利用権を提供し、それを超える場合は従量課金(有償)となる。また、クラウドサービスを利用できない場合のために、オンプレミス版の提供も予定しているとのこと。

 このほか今回は、OCR読み取り時の精度が100%ではないことを踏まえ、画面上のイメージを見ながら認識した値を修正できるインターフェイスを用意した。画面上のイメージでは、誤認識が多い箇所をハイライトさせ、正確度に合わせて色をつけて表示できるので、修正がしやすくなる。さらに、各種申込書類やアンケートに手書きで記入した丸囲いのデータ化にも対応した。

確認修正効率を向上させるインターフェイス

 加えて、処理量の増加と、可用性の高い構成を可能にする「SPA Enterprise」をラインアップに追加。SPAのオプションとして、アーカイブされたデータをリアルタイムに可視化する「SPA 可視化オプション」も新たに提供する。

 SPAでは、オンプレミス向けのパッケージ版と、クラウドサービス版「SPA Cloud」が提供されており、パッケージ版の価格は、初年度の保守費用を含めて379万5000円(税別)から。SPA Cloudは10ユーザーで月額5万円(税別)からとなり、3月18日の提供開始を予定している。

 なおウイングアーク1stでは、「DEEP READ利用権2倍キャンペーン」を8月末までの期間限定で実施する。対象は、期間中にSPAを購入またはSPA Cloudに申し込みをしたユーザーで、初年度のみ、DEEP READの無償利用権が通常の2倍(年間60万画像)になるとのことだ。