ニュース
セゾンテクノロジー、社内データをRAGとして読み込むための事前加工を支援するスクリプトを「HULFT Square」で提供開始
2025年7月24日 10:00
株式会社セゾンテクノロジーは23日、生成AIのRAG(検索拡張生成)として読み込む社内データを事前加工する「HULFT Square」向けデータ連携スクリプト「AI前処理テンプレートシリーズ」10種類を、7月23日より順次提供開始すると発表した。HULFT Square経由で生成AIとデータを連携させ、事前加工の作業を生成AI自体に任せることで、RAGとしてデータを読み込むために必要な、生成AIが理解しやすい状態に社内データを前処理できるという。
HULFT Squareは、「データ活用するためのデータ準備」や「業務システムをつなぐデータ連携」を支援する、日本発のiPaaS(Integration Platform as a Service)。オンプレミス・クラウド・SaaSなどの環境に分散して管理されている多様なデータを、業務システム間、業種、国・地域をまたいで連携できるようにしているという。
このHULFT Squareでは、ワークフローやスクリプトをパッケージ化して1つのアプリケーションとして扱い、可搬性を高めてテンプレートとして利用できるようにしている。今回はそのひとつとして、生成AIに最適なデータに加工する「AI前処理テンプレートシリーズ」を提供するとした。
社内データの種別に応じて10種類のテンプレートを利用することにより、スプレッドシート、マニュアル、スキャンPDF、画像データ、音声データ、HTMLなど、社内に存在するさまざまな業務データから、タグなどの不要なノイズを除去したテキストを抽出できるほか、非構造化データから構造化データへの変換、データへの適切なリレーション付与などを行える。
セゾンテクノロジーによれば、「HULFT Square」から生成AIを経由して、社内データを生成AIが参照しやすいデータに事前加工することで、生成AIの回答精度が最大90%向上するとともに、データ加工にかかる作業工数も50~60%程度省力化できるとのこと。
第1弾としては、マニュアル類のPDFデータを、QA形式に変換した構造化データとしてCSV形式で出力できる「AI前処理 PDFからQA表作成」を7月23日に提供。8月には、企業Webサイトや社内ポータルサイトなどのHTMLドキュメントからタグを除去し、マークダウン記法で出力する「AI前処理 HTMLタグの削除」、HTMLドキュメントから特殊記号や記号を削除しテキスト形式で出力する「AI前処理 特殊文字・記号の削除」などの4種類を提供する予定で、以後も順次、テンプレートの提供を開始するとしている。