ニュース

NTTテクノクロスの匿名加工情報作成ソフト「tasokarena V4」、データの有用性を維持した架空パーソナルデータを合成可能

 NTTテクノクロス株式会社は、匿名加工情報作成ソフトウェア「tasokarena(タソカレナ)」において、NTT研究所の新たな匿名化技術を活用し、合成データ生成機能を搭載した新版「同 V4」を、11月17日から販売開始すると発表した。

 tasokarenaは、NTT社会情報研究所が開発した「Pk-匿名化技術」を活用し、パーソナルデータの特性や利用目的に応じた匿名加工情報の作成を支援するソフトウェア。

 今回の新版では、元のパーソナルデータから特徴量や統計量・分布などが類似するデータを生成し、「実在しないが具体的なパーソナルデータ(合成データ)」を作り上げる「合成データ生成機能」を搭載した。

 匿名性やプライバシーを守りつつ、分析に必要な元のデータの性質を保持したデータを生成するため、従来の匿名加工情報作成ソフトウェアによるパーソナルデータの一般化や削除、ランダム化されたデータと比べて、より緻密(ちみつ)なデータ分析が可能という。少ないデータから匿名化された大量の合成データを生成できるので、NTTテクノクロスでは、膨大なデータを必要とするAIの学習や訓練などに活用できると説明している。

 なお同機能には、NTT社会情報研究所の特許技術である「合成データ生成技術」を活用している。各属性の平均など、統計値が元データとほぼ等しい合成データを生成する技術等を独自に開発することにより、これまでのプライバシー保護技術では実現できなかった、分析に必要な複数の統計値を保持する多属性の合成データを生成可能になったとのことだ。

 tasokarenaの価格(税別)は、スタンダード版(GUI版)が年間60万円から、エンタープライズ版(スタンダード版+自動実行/データ連携機能)が年間180万円から。

「tasokarena」による合成データ生成のイメージ