トピック

ダイレクトクラウド、AI・人工知能EXPOで手書きの帳票を自動で文字認識し、機微情報の持ち出しも制限できる「DirectCloud-OCR」を公開

AI・人工知能EXPOブースレポート

 4月7日~9日、東京ビッグサイト 青海展示棟にて、「AI・人工知能EXPO【春】」「ブロックチェーン EXPO【春】」「量子コンピューティング EXPO【春】」が開催された。「AI・人工知能EXPO」に出展した株式会社ダイレクトクラウドのブースでは、企業向けクラウドストレージ「DirectCloud-BOX」について、6月リリース予定の新機能としてAI-OCR機能「DirectCloud-OCR」を紹介していた。

株式会社ダイレクトクラウドのブース
DirectCloud-BOXのAI-OCR機能の展示

クラウドストレージ「DirectCloud-BOX」にファイルを置くだけでOCRを実行

 DirectCloud-BOXは、IDとパスワードに頼らない高度なセキュリティを確保しながら、ファイルサーバーでこれまでできていた厳格なファイル管理の実現とクラウドストレージとしての柔軟性を売りにしている。同期型ではなく、Webブラウザーからアクセスするか、エクスプローラー上でファイルを直接編集できる「DirectCloudドライブ」を利用することで、ファイルがローカルに残ることなく利用できる。

 6月に新しくリリースされるDirectCloud-OCR機能は、DirectCloud-BOXの特定のフォルダに帳票をスキャンしたファイルを置くと、自動的にOCRが実行されるというものだ。

 事前に帳票の読み取りフィールドと形式を登録しておくことで、スキャンした帳票のフィールドごとのテキストが得られ、CSVにエクスポートすることもできる。DirectCloud-BOXのAPIを用いて既存の業務システムと連携すれば、スキャン画像から取得したテキストの既存システムへの入力までを自動化することができる。

 DirectCloud-OCRは、DirectCloud-BOXのオプション機能として提供される。OCR部分は、AI inside株式会社のクラウドサービス「DX Suite」を利用している。ユーザーの契約としては、DirectCloud-BOXにオプションを追加するだけで、DirectCloud-BOXからOCRへのフローが自動化される。

 この機能の狙いについて、株式会社ダイレクトクラウド 代表取締役の安貞善氏は、手書きの帳票、特に各種の申込書について、「コロナ禍で企業のデジタル化は進んでいるが、まだまだ紙ベースの業務も多い。申込書はビジネスにおいて重要な意味を持つだけでなく、機微な情報が含まれているため、セキュリティを考慮しないといけない」と説明。「DirectCloud-OCRを使うことによって、大量の手書きの帳票を指定したフォルダに送り込むだけで自動的にテキスト化し、CSVファイル形式で出力ができるので、手間とコストを削減できる」という。

 ブース内で開かれたミニセミナーでも、月に約100件の申込書をデータスキャンする場合を例にして、スキャンしてからOCRにかけ、確認と修正などを経て業務システムに入れるところまで、スキャンした後の手間が大変だと説明。それに対して、DirectCloud-BOXのOCR機能では、あらかじめ帳票の読み取りフィールドを設定しておけば、ファイルを特定のフォルダにアップロードするだけで文字認識が実行され、DirectCloud-BOX上で取得されたテキストの確認・修正などが簡単に行えると語った。

株式会社ダイレクトクラウド 代表取締役の安貞善氏
OCRのこれまでの課題と、DirectCloud-BOXでの解決

フィールドごとにテキストを取得、情報漏洩防止や検索も適用

 使い方としては、事前に目的の帳票をスキャンした画像を元に、スキャン対象の各フィールドを定義してテンプレートを作る。テンプレートでは、文字を書き込むフィールドのほか、選択項目なども指定できる。そして、DirectCloud-BOX上の任意のフォルダに対して、OCR対象にする設定をする。OCRの設定としては、PDFやJPEGなどのファイルの種類とともに、そのフォルダに置かれたファイルにどのテンプレートを適用するかを指定できる。

テンプレートの作成画面
フォルダでテンプレートを指定する

 作業者は、そのフォルダにファイルをまとめて置くだけで、OCRを実行できる。OCR結果は、アクセス権限などと同様にファイルのメタデータとして記録され、Web版のDirectCloud-BOXのプレビュー機能で確認できる。修正もその場でできる。

特定のフォルダにファイルを置くだけでOCRが実行される
「DirectCloud利用申込書(3P)_01.pdf」をOCRで読み取っているところ
読み取り結果。ここで修正もできる

 さらに、DirectCloud-BOX上でOCRを実行することで、情報漏洩防止機能の「DirectCloud-SHIELD」も適用される。DirectCloud-SHIELDは、事前に設定されたキーワードを文書中から検出して機密レベルを自動的に設定し、暗号化やアクセス制限などの保護を適用できるものだ。OCRによってテキストが抽出されたタイミングでDirectCloud-SHIELDによりチェックされ、キーワードがヒットすれば保護の対象となる。

 そのほか、OCR機能で読み取ったテキストは、DirectCloud-BOXの検索機能でも検索対象とすることができる。

 ブースでは、OCR対象のフォルダにファイルを置いたところでOCRが開始されるところがデモされた。OCRが完了するとDirectCloud-BOXのファイル一覧内で「OCR」のラベルが付き、さらに「極秘」などのDirectCloud-SHIELDのラベルも付く。

OCRされた結果からDirectCloud-SHIELDにより極秘文書として対応された
読み取ったテキストはDirectCloud-BOXの検索機能でも検索対象になる

 AI-OCR機能の料金体系は、AI insideのDX Suiteに準拠しており、スモール、ミディアム、ラージの3つのプランがある。スモールは、初期費用0円で月額3万円~、リクエスト(フィールド数)単価が文字あり3円・文字なし(選択項目も含む)3円、無料枠が6000リクエスト。ミディアムは、初期費用20万円で月額費用10万円~、リクエスト単価が文字あり1円・文字なし0.5円、無料枠が5万リクエスト。ラージは、初期費用20万円で月額費用20万円~、リクエスト単価が文字あり1円・文字なし0.1円、無料枠が20万リクエスト。

複合機やFAXとの連携も計画

 安氏は、AI-OCR関連機能について、今後の計画を2つ語った。1つは複合機(スキャナー)との連携で、複合機などでスキャンしたら結果がそのままDirectCloud-BOXの所定のフォルダに保存されるものだ。それにより、スキャンしたファイルを特定のフォルダに入れる作業は必要なく、スキャンするだけでAI-OCR機能が自動で実行されることになる。

 この機能が実現すれば、帳票をスキャンするだけで発注などのデータを自動的にシステムに入力できる。この機能について安氏は「2021年内を目標にリリースしたい」と語った。

 もう1つはFAX連携だ。インターネットFAXとの連携も7月にリリース予定にしているという。インターネットFAXでFAXが届くと、DirectCloud-BOXに入り、事前にFAX番号とひもづけた取引先ごとのフォルダに仕分けられる。それがDirectCloud-TALK(チャットアプリ)で確認できるほか、DirectCloud-TALKからFAXを送信することもできるという。

 安氏は、「紙ベースの業務は、テレワーク定着の障壁となり、生産性向上を妨げる要因でもある。しかしながら、デジタルに慣れてない高齢者や障がい者の方もおられるので、紙ベースの業務は今後も利用を続けると予測されている。そこで、ダイレクトクラウドでは、データレス編集やファイル暗号化のような高度な機能のみならず、複合機やFAXなどの従来のシステムと連携を行い、DirectCloud-BOXならではの高セキュリティと利便性を生かしたサービスを提供することで、デジタルトランスフォーメーション(DX)に取り組む国内企業を全力でサポートしていきたい」と語った。