ニュース
マクニカ、RAG構築に向け非構造化データの整備を自動化する「Unstructured」を提供
2026年4月1日 09:00
株式会社マクニカは3月30日、米Unstructured Technologies(以下、Unstructured)と国内初の販売代理店契約を締結し、非構造化データをLLM(大規模言語モデル)が扱いやすい形に自動的に整備するプラットフォーム「Unstructured」を提供開始すると発表した。
マクニカでは提供の背景として、LLMの普及により、生成AIを活用したナレッジ検索や業務効率化への期待が高まっており、社内文書を活用したRAG(検索拡張生成)の構築に取り組む企業が増えていると説明する。一方、企業内に存在する営業資料、契約書、マニュアル、技術文書などの非構造化データは、ドキュメントの形式が多岐にわたるため、段落や見出し、表、画像といった構造をAIが正確に把握できないケースが多く見られる。その結果、RAGにおいて検索漏れや文脈の誤解釈が生じ、PoCでは問題なく動作しても、本番環境では精度が安定しないといった課題が顕在化している。
そのため、RAG構築においては、こうした非構造化データをAI活用に適した形へ整備することが不可欠となるが、一般的なデータ整備プロセスでは、設計担当者が文書ごとにチャンク設計や情報抽出ルールを設計・調整する必要があり、高い専門性を要するうえに属人化しやすいといった課題がある。さらに、文書量の増加や内容更新のたびに再調整が発生するため、運用フェーズにおける工数負荷は継続的に増大し、AIモデル自体の性能ではなく、データ整備および運用の負荷がボトルネックとなり、生成AI活用の本格展開に至らない、あるいはプロジェクトが停滞してしまうケースも少なくないという。
Unstructuredは、非構造化データをLLMが扱いやすい形へ自動的に整備するプラットフォームで、一つの文書内に含まれる段落や見出し、表、画像などの構造を保持したままJSONに変換することで、RAGの精度および安定性の向上に寄与する。これにより、従来は設計担当者が文書ごとに行っていた細かいチューニング作業や更新文書への再対応に伴う工数を削減し、属人化の解消と継続的な運用負荷の軽減を実現する。
各種クラウドサービスと標準コネクターで連携し、非構造化データを他ストレージに移動・複製することなく、更新を含めた継続的な処理を可能にする。文書構造を考慮したパーティショニングや、意味を損なわないチャンク設計、後段のAI処理を見据えたメタデータ付与により、非構造化データをそのまま業務で活用できる状態に変換する。
ノーコードのGUIを備えており、複雑な非構造化データ処理を、専門知識を持たないユーザーでも安定して実行できる。コンプライアンスおよびセキュリティ基準の面では、HIPAA、SOC 2 Type 2、GDPR、ISO 27001など、データ保護および情報セキュリティ関連の法令、規制、業界標準に準拠する。
マクニカは今後、企業が既に利用しているデータ基盤やコンテンツ管理基盤との連携設計から導入まで一貫して支援することで、日本企業における生成AIの実用化を加速していくとしている。
