ニュース

TIS、アーカイブ文書として保存されている大量の紙文書をデジタル化できる「文書アーカイブDXサービス」を提供

 TIS株式会社は24日、仕様書・研究論文・設備点検報告書などの紙文書をデジタル化し、企業資産の有効活用につなげる「文書アーカイブDXサービス」を提供開始すると発表した。

 文書アーカイブDXサービスは、過去の仕様書・研究論文・設備点検報告書などを紙で活用している顧客向けに、紙のデジタル化からAI OCRで記載されている画像・文字をテキスト化するサービス。アーカイブ文書として紙で保存・保管している資産をデジタル化することで、文書捜索に要していた時間の短縮と、過去に実施した研究結果の活用や重複研究の防止、情報共有による技術伝承などに役立てられる。

「文書アーカイブDXサービス」のイメージ

 TISインテックグループが提供する紙文書のスキャニングプロセスをアウトソーシングできる文書スキャンBPOと、TISのAI-OCRトータルサービス「Paperoid」の「ドキュメントAI-OCRサービス」を組み合わせ、一気通貫で提供する。大量のスキャン作業を、文書スキャンBPOを使ってアウトソーシングし、ドキュメントAI-OCRサービスでシームレスに文書画像のテキスト化を図ることで、企業資産として活用するために時間を要していた文書画像などのアーカイブデータを効率的にデジタル化し、業務での有効活用を可能にする。

 文書の画像化に向けたホチキス外しやファイル取り出し、裁断などのスキャン作業をアウトソーシング可能。読み取り箇所の定義をAIが自動で認識するため、OCR化する文字の範囲を手動で指定する必要がなく、対象の原本PDFに含まれる文字をすべてテキストデータ化できる。Paperoid上だけでなく、読み取った文書画像データを出力するとPDFに透明テキストとして埋め込まれるため、ファイル自体から直接キーワード検索できる。

 TISでは今後、紙文書のデジタル化だけでなく、NLP(自然言語思慮)と組み合わせて項目や文章が異なる類義語を同様の趣旨として理解させて抽出することや、テキスト解析による要約化や文章構造を理解して原因分析に使うなど、顧客の用途に合わせた高度な文書活用を提供していくとしている。