ニュース

リアライズ、法人顧客リストのクリーニングおよびマッチング処理をAI技術で自動化する「Data-Master」トライアル運用を開始

「Data-Master」の概要。分散した法人顧客リストの企業名を正式社名とマッチングする

 NTTデータグループの株式会社リアライズは19日、企業が持つ法人顧客リストを、人工知能(AI)を用いて最適化する「Data-Master」のプロトタイプシステムを、株式会社NTTデータの技術支援を受け、開発したと発表した。

 システムは、リアライズが持つ企業名などのシソーラス(履歴や呼び名、事業所などの辞書)のナレッジと、AI技術を融合し、法人顧客リストのクリーニングおよびマッチング処理をAI技術の活用により自動化するもの。システムによるサービス提供が実現することで、企業で部門ごとに管理されているデータや、正式名称と略称、入力ミスなど、これまで人間が目視で個々に判断し修正する必要のあった重複データの識別や統合処理を、自動かつ高速に行うことが可能となる。

 リアライズ代表取締役社長の大西裕史氏は、企業内では顧客リストが活用目的別や部門別などでバラバラに管理されているケースが多く、マーケティングなどでデータが有効に活用できない原因にもなっていると説明。例えば、リスト中の会社名には、「NTT DATA」「株式会社NTTデータ」「株式会社エヌティティデータ」など、正式社名以外のさまざまな表記が用いられていることや、入力ミスや省略、組織内での通称や略語が用いられていることが多く、こうしたデータの統合には大きな手間が必要だとした。

リアライズ代表取締役社長の大西裕史氏
顧客リストの統合における問題

 Data-Masterでは、リアライズがこれまでデータマネジメント事業で培ってきた、企業名や住所表記などのシソーラスと、AI技術を融合。リアライズが保有している正解データの作成ノウハウを活かし、AIに与えて育てていくことで、高いマッチング精度を実現したという。

 企業名に対して、欧文やカタカナの表記ゆれ、人手による誤入力、OCRの誤読み取り、業界内で用いられている呼び名や略称、吸収合併による旧社名と新社名のデータなど、各種の表記の違いに対応。複数の候補がある場合にはマッチング候補を提示するなど、きめ細かな対応を実現するとした。

全半角違い、中黒の有無、アルファベットとカナの混在といった表記ゆれにも対応する
OCRの誤読み取りにも対応
社名変更や吸収合併にも対応する

 10月19日からは、基本サービスとなる「Data-Master 01」のトライアルを開始。ExcelまたはCSVファイルによる法人顧客リストをアップロードすることで、各会社名に対して法人マイナンバーと登記法人名、登記住所、マッチ率などが付与されたファイルをダウンロードできるサービスを提供する。

 サービスは、Salesforce Community CloudおよびAmazon Web Services(AWS)上に実装されており、API方式や各種サービスとのモジュール方式などによる連携についても順次提供予定。NTTデータグループの企業を中心に導入効果の検証を進め、2017年1月以降の本格サービス提供を目指す。

顧客リストをアップロードすると、マッチング&クリーニングされたデータを受け取れるサービス「Data-Master 01」のトライアルを開始
アップロードするファイルのイメージ
処理結果ファイルのイメージ

 サービス料金については、正式サービスの提供までに決定する予定だが、リスト件数が月間5000件を超えない場合でマッチング件数1件あたり50円程度の低廉な料金体系を検討しているという。

 また、今後は、顧客データがつながる状態になった上で、部門カテゴリーや業種カテゴリー、従業員レンジ、売上規模レンジ、グループ会社関係などを付与して返却するサービスの提供も予定。さらに、企業内で発生する顧客リストデータを常にきれいな状態に保つサービスについても検討していくとした。

今後はさらに部門カテゴリーや業種カテゴリーなどを付与するサービスを予定

 株式会社エヌ・ティ・ティ・データ(NTTデータ)の横田雅弘氏は、Data-Masterの検証により分かった効果について説明。手作業で行う場合に比べて、期間は80%減少、コストは50%減少、正確性も手作業以上の成果が得られたが、何よりも最大の効果は「精神的負担の軽減ではないかと思う。単純作業が待っているのかと思うと、モチベーション的に大きなマイナスになるが、それが機械化できることによる効果は大きいと思う」と語った。

NTTデータが行った検証では、期間、コスト、正確性とも手作業より優れていたが、最大の効果は精神的負担の軽減にあるのではないかとした