ニュース

さくら情報システム、生成AIとAI-OCRを組み合わせたデータ化サービス「AI TextSifta」

 さくら情報システム株式会社は4日、生成AIとAI-OCRを組み合わせたデータ化サービス「AI TextSifta(テキストシフタ)」を提供開始すると発表した。

 AI TextSiftaは、画像や写真、PDFを高精度にデータ化できるAI-OCRサービス。非定型PDFやイメージデータはテキストデータに変換したうえで、生成AIが抜き取りたいデータを判断する仕組みで、「請求金額合計」「合計金額」といった異なる項目名でも、同じ意味を持つ値として抽出できるという。また、英字の請求書や各種画像イメージなどの取り扱いも可能だ。

 なお、データ化すべき項目名は生成AIに入力するプロンプトで指示する必要があるが、同サービスで利用するプロンプトはさくら情報システムが作成してくれるとのこと。加えて、生成AIの利用により、単に文字を読み取るだけでなく、読み込んだデータをもとにした簡単な計算、情報の追加などにも対応する。

 さらに、複雑な複数のフォーマットに対し1つのプロンプトでは対応できない場合、事前にプロンプト(1)でグループ分けを行い、別のプロンプト(2-1、2-2)でグループに合った指示を行う、といった処理も可能とのこと。

 AI TextSiftaの利用にあたっては、Web経由でPDFや写真をアップロードして読み取り結果をダウンロードするか、API経由で連携するかのどちらかを選択可能だ。

 料金は帳票の種類等によっても異なるが、一般的な請求書を用いた場合の参考価格は、日本語の請求書が1ページあたり20円から、英字の請求書が1ページあたり30円から。