ニュース

AI-OCRサービス「DX Suite」の項目抽出機能を強化、修正内容を自社環境内で個別学習する新機能を提供

 AI inside株式会社は26日、AI-OCRサービス「DX Suite」において、「項目抽出」の抽出精度向上を目的に、修正内容を自社環境内で個別学習し、使えば使うほど読取精度が向上する新機能「Few-shot(フューショット)学習」を実装したと発表した。

 DX Suiteは、定型・非定型に関係なく、さまざまなフォーマットの書類を事前学習不要で読み取れるAI-OCRサービス。従来のOCRでは読み取りが困難とされた手書き文字も高精度に読み取れることから、人手で行っていたデータ化作業の自動化を支援できるという。

 同サービスでは、生成AI技術を生かして、発行元によってレイアウトの異なる非定型帳票でも、情報を抽出・デジタルデータ化できる「項目抽出」機能を提供。1000種類以上の非定型帳票プリセットを搭載するほか、プリセットにない独自フォーマットの帳票でも、利用者が読み取りたい情報のキーワード・項目を登録するだけで、即座にデジタルデータに変換できるように支援してきた。

 今回はこの「項目抽出」において、過去にチェック済みの「読取結果の正解」データを参考データとして扱うことにより、抽出精度を向上させる「Few-shot学習」機能を新たに提供する。従来のように大量のデータが必要な学習とは異なるアプローチで、1枚の帳票の読取結果を参照するため、独自帳票などの学習データが少ない帳票でも、読取精度の向上が期待できるとのこと。

 また同機能は、AI学習コントロールにおける「学習機能」とは別の機能で、「Few-shot学習」を利用してもAIモデルに学習データとして利用されることはなく、各社の環境内で完結する仕組みのため、セキュリティ面も安心して利用できるとした。