ニュース

KDDI研究所、複数の匿名化手法を組み合わせて安全性の評価が可能な匿名加工情報作成ツールを開発

 株式会社KDDI研究所は29日、事業者が所有するパーソナルデータの多面的な安全性を考慮した匿名加工情報の作成が可能なツールを、世界で初めて開発したと発表した。

 開発した技術は、従来のようにk-匿名化だけを考慮するのではなく、サンプリングなど複数の匿名化手法を組み合わせることで、より有用な匿名加工情報を作成することが可能となるもの。

 従来、k-匿名化、ノイズ付与、ランダムサンプリングといった加工手法ごとに異なる安全性(匿名化の度合い)が決められていた。今回開発したツールでは、データセットの特徴を抽出、指標間の関係性をモデル化することで、それぞれの安全性を同一の指標で評価できるようにし、これらの加工手法の最適な組み合わせを求めることが可能になった。

 安全性を満たすために強いk-匿名化を行い、有用性が大きく損なわれるような場合でも、ツールでは別の手法を組み合わせることで、同じ安全性で高い有用性を持つデータの生成を行うことができる。手法の組み合わせは選択可能なため、医療データのように繊細なデータの加工を行う場合は、サンプリングと汎化、レコードの削除のみを使用し、ノイズ付加は行わないといったことも可能となっている。データの生成時には、k-匿名性以外にも懸念されるリスクについて多面的な評価を行って可視化しレポートとして出力するため、ひと目で生成した匿名加工情報が持つ安全性を確認できる。

 これまで、各匿名化手法の安全性指標は単純に比較することができなかったが、データの特徴などを元に複数の匿名化手法を組み合わせた場合でも、k-匿名性と同じ基準で安全性の評価が可能となる。これにより、複数の匿名化手法を組み合わせた場合でも、どちらのほうが安全であるかの確認が可能となり、匿名化手法の幅が広がることが期待できるとしている。

 KDDI研究所では今後、社内外で開発したツールの実証実験を行い、その結果を元に匿名化手法の最適化を検討。また、大規模データに対応できるように、加工や評価をクラウド上で行うことで高速化を図るなど、実用化を目指した技術開発に取り組んでいく。

 実用化の際には、ビッグデータを所有する機関が、求める安全性と有用性を両立した価値のあるデータセットの作成が可能となり、データの安全性を審査する機関やデータに含まれる各個人は出力されたレポートを確認することで、その安全性を評価することが可能になるとしている。