ニュース

多様な文書からAIで情報を抽出して定型化――、NRIがデータ活用支援ソリューション「Shingan」を提供

 株式会社野村総合研究所(以下、NRI)は28日、フォーマットが異なる複数の文書から、AIを活用して自動的にデータを抽出し、後続のシステムへ連携するためのソリューション「Shingan」を、同日より販売開始すると発表した。

 Shinganは、以前より利用されてきた形態素解析や構文解析といった日本語処理技術と、機械学習や深層学習(ディープラーニング)技術とを組み合わせることにより、自然言語から固有表現を抽出し、非定型データをシステムで取り扱えるデータに整えて、後続のシステムへの連携を行えるようにするソリューション。

Shinganを利用した、非定型データを抽出する流れ

 具体的には、非定型データからMicrosoft Excel形式でデータを抽出することが可能。抽出したデータとその確度はダッシュボード画面で確認できる。

 作業にあたっては、読み込む文書の特性に応じて、事前に学習させた最適なAIと辞書を抽出に利用。そのデータ抽出の確度をさらに向上させるために、AIと辞書の最適な組み合わせ設定はNRIが継続的にサポートするという。

 なおShinganの販売に先駆けて、NRIではフォーマットが異なる文書を多く取り扱っている、投資信託における各種業務を対象に実証実験を行った。

 野村アセットマネジメント株式会社と、運用報告書に記載されている各種文章の整合性チェックについて、またNRIプロセスイノベーション株式会社とは、項目の抽出と他システムへのデータ連携についての検証を実施。これらの実験で得た知見を生かして、Shinganでの確度向上や機能強化・改善などに引き続き取り組んでいくとしている。

 Shinganの利用料金(税別)は、導入と稼働までのコンサルティング料金が100万円から、月額利用料が30万円から。NRIでは、金融に限らずさまざまな業界を対象に展開し、今後3年間で約20社への導入を目指すとのこと。

Shinganで文書からデータを抽出した画面