ニュース

パーソルP&T、ディープラーニング技術を生かしたOCRエンジンを開発 非定型の帳票から必要な情報を抽出可能に

 パーソルプロセス&テクノロジー株式会社(以下、パーソルP&T)は7日、株式会社Sigfossと協業し、ディープラーニング(深層学習)技術を活用したOCRの文字認識技術を共同開発したと発表した。非定型の帳票から必要な情報を抽出しデジタルデータ化するソリューションを、同日より提供開始している。

 従来のOCRでは、「書類のこの位置にこの文字がある」と座標を指定して、文字の認識や読み取りを行っていたため、詳細な設定が必要だったほか、崩れた手書き文字や罫線・線、異なる背景色などから、高い精度で文字を認識することは困難だったという。

 これに対して今回開発されたソリューションでは、ディープラーニング技術を活用したOCRエンジンが、非定型の帳票から企業名、名前、住所などの文字を認識し、アナログデータからデジタルデータに変換してくれる。

 具体的には、あらかじめ読み込ませた帳票から特徴を抽出し、OCRで読み取った情報と文脈や出現場所から文字を認識する仕組み。また、結果を継続的に蓄積・学習することで、文字認識の正確性が向上していくとのこと。

 なおパーソルP&Tでは、これまでに培ってきたBPRやRPAの導入ノウハウを生かし、文字のデジタルデータ化だけでなく、その後のデータ移行などを自動化するRPAや、導入支援コンサルティングなどと組み合わせ、さらなる業務効率化を支援するとしている。