トピック

世界トップクラスの精度を誇るLINE独自開発のAI-OCRで「特定帳票」などバックオフィスの事務作業を大幅に効率化

 伝票や領収書の読み取り、モバイルアプリ上における煩雑な入力作業などを簡潔化するLINEの「CLOVA OCR」。定型書類はもちろん、非定型や特定帳票などあらゆるスタイルの書類を正しくテキスト化し、その後の業務プロセスと自動的につなげることで、バックオフィスの事務作業などに費やす時間とコストの大幅削減を実現する。

独自のAI技術を駆使して開発したOCRのクラウドサービス

 日常業務で大量に使われている“紙”――そこに書かれた文字を読み取りテキストデータ化するOCR(Optical Character Recognition/Reader)は、さほど目新しい技術ではない。昨今では、OCRとRPA(Robotic Process Automation)を連携させて一連の業務プロセスを自動化する取り組みも加速している。

 だが、これまでのOCRは、期待ほどの業務効率化には貢献できていないなかったのが実情だ。多くの企業に導入されているOCRは定型タイプと呼ばれるもので、事前のレイアウト設定が必要となり、登録外の書類には対応できない。そもそも文字の認識精度が低く、人間の目視による照合チェックや修正作業に多大な工数を費やしている。

 そこでLINEが新たに打ち出したのが、AI技術を活用した独自開発のクラウドサービス「CLOVA OCR」である。

LINE株式会社 AI事業推進室 DXコンサルティングチーム 引間明子氏

国際会議で認められた世界最高水準の認識精度

 CLOVA OCRの特徴を掘り下げてみていこう。

 まず注目すべきは、従来のOCRでは困難だった広範な書類に対応していることだ。事前にレイアウト設定された定型の書類はもとより、非定型の書類にも対応し、文書様式を問わず、読み込んだ画像に含まれるすべての文字情報をテキストデータ化する。

 LINE AI事業推進室 DXコンサルティングチームの引間明子氏は、「CLOVA OCRは横書きだけでなく、縦書きの文字でも認識できます。また、従来のOCRはスキャナできれいに読み取った画像が対象でしたが、スマートフォンで撮影した画像からの認識も得意で、正面から撮影できていない文字、傾きのある文字、湾曲した文字などの悪条件下や手書き文字でも精度高く認識できます」と強みを説明する。

 CLOVA OCRは、ICDAR(文書解析と認識に関する国際会議)において、「テキスト検出・文字認識(9言語の総合ランク)」、「テキスト検出・文字認識(英語)」、「悪条件下での読み取り(主に日・英)」、「専門用語の読み取り(英語・生物医学論文)」の4分野において、世界No. 1(2019/3/29時点)を獲得した。こうした世界的な評価からもCLOVA OCRの高い認識精度を知ることができる。

フォーマットが定まっていない「特定帳票」にも対応

 さらにCLOVA OCRの最大の特徴と言えるのが、フォーマットが定まっていない請求書や領収書、免許証やパスポート、名刺などの「特定帳票」の読み取りだ。CLOVA OCRは読み取った画像から、書類の発行元、会社名、住所、日付、品目、金額などの「項目(キー)」とその「中身(バリュー)」を自動で判別してテキストデータ化できるのである(図1)。

図1:事前設定なしで、請求書や領収書などの特定帳票の文字を自動で分類できる

 「特定帳票の読み取りは、バックオフィスで大量の請求書や領収書を処理しているお客様から多くの要望が寄せられていたものです。様々な取引先から送られてくる請求書や領収書は自分たちの都合でフォーマットを定義しようがなく、OCRで読み取ることが非常に困難でした。特定帳票にも柔軟に対応できるCLOVA OCRがこの課題を抜本的に解決しました」(引間氏)

 CLOVA OCRで読み取った特定帳票のテキストデータを項目ごとに自動的に仕分け、ERPやワークフローなどのシステムに直接入力したり、RPAと連携させたりすることが可能となるのである。

 例えば領収書の品目に「航空券」と記載されていた場合、その金額が経理上の「交通費」に該当するといった仕分けまでRPA上で自動的に行えるようになる。従業員は出張旅費精算申請書を別途作成して添付する必要はなくなり、経理部門側の目視確認やシステムへの再入力、集計作業などの手間も削減され、業務効率は格段にアップする。

 もちろん、特定帳票対応の実現は容易なことではなかった。実用レベルの精度を得るためには、膨大な数の帳票サンプルを集めて機械学習を重ねる必要があるからだ。どの項目がどのデータに関連しているのかタグ(注釈)を付与するアノテーション作業にも膨大な工数を費やすことになる。充実したAIの開発体制を擁するLINEだからこそ実現できた機能と言えるだろう。

 なお、学習データとして用いる帳票サンプルは、CLOVA OCRのユーザーによってアップロードされた画像ではなく、あくまでもLINEが独自に収集したものを利用している。「お客様がアップロードされた画像は、テキストデータへの変換が終わった時点で即座にクラウドから消去されます。LINEがお客様のデータを勝手に利用することは決してありません」(引間氏)。

コミュニケーションアプリ「LINE」と連携した活用も拡大

 さらに、LINEならではの活用といえば、コミュニケーションアプリ「LINE」との連携だろう。

 例えば渋谷区は、LINE公式アカウントを活用して住民票・税証明書の申請を可能とするオンライン申請を2020年4月より開始、そこで必要となるeKYC(オンライン本人確認)にCLOVA OCRを活用したLINE eKYCを採用した。LINE経由で送られてくる身分証の画像をCLOVA OCRで読み取り、氏名や住所などを自動判別してテキストデータ化する。さらにチャットボットで必要な項目を聴取し、オンラインでの本人確認を行うというものだ。

 「申請書や契約書で、氏名や住所などを何度も記入しなければならないケースは珍しくありません。LINE経由で読み取った身分証の画像をCLOVA OCRでテキストデータ化し、書類の該当箇所に自動的に転記すれば、紙を使う必要はなくなり、手書きの手間は大幅に軽減されます。例えばカーシェアリングや短期間の海外旅行保険などを申し込む際に、LINE Payと連動して支払いまで完結させるなど、CLOVA OCRとLINEの連携が活躍する場面はどんどん広がっていくと考えています」(引間氏)

 その意味で、リーズナブルな利用料金も、多様な業務への普及に弾みをつける原動力となりそうだ。CLOVA OCRは、一項目あたりではなく書類一枚あたりというユニークな課金方式を採用しており、一枚の中に何項目あろうが一定の金額である。例えば非定型の読み取りであれば、画像1枚あたりわずか0.2円、すなわち10万枚の画像もわずか2万円でテキストデータ化することができる。

 これまで中小規模の企業がOCRを活用したいと思っても、高額な利用料金がネックとなっていた。CLOVA OCRならば十分に導入可能なレベルであり、スマートフォンで撮影した画像からも認識ができるという利便性とあわせ、広範な業務の効率化とコスト削減に貢献できるだろう。

<お問い合わせ先>
LINE株式会社 AIカンパニー
LINE CLOVA公式サイト:https://clova.line.me/
お問い合わせはこちら:https://lb.clova.line.me/contact.html
OCRデモサイトはこちら:https://clova.line.me/ocr_demo/en