ニュース
神戸市、オープンデータ推進に向け匿名化の実証実験を実施
日立ソリューションズの技術でデータを「k-匿名化」加工
2021年3月16日 15:49
兵庫県神戸市と株式会社日立ソリューションズは16日、オープンデータの推進に向けて、より価値の高いデータ提供を可能にするため、個人を特定できないような匿名化したデータを作成する実証実験を行ったと発表した。両者はこれにより、匿名データを分析に使用することの有用性を確認したという。
一般的に、集計された統計情報よりも1件1行の個票形式の方が分析には適しているものの、個人を特定できない状態に匿名化することは時間的、技術的に困難な状況だったとのこと。そこで、神戸市は日立ソリューションズの協力を得て、統計情報から作成した個票形式のデータに匿名化を施し、分析精度に影響がないことを検証することにした。
具体的には、日立ソリューションズの「プライバシー情報匿名化ソリューション」の技術を採用している。これは、データの利用価値を保持したままで高い匿名性を実現する「k-匿名化」を行い、パーソナルデータを個人情報保護法にのっとって安全に利活用できるよう支援するもの。k-匿名化では、対象となるデータ内に同じ属性値を持つデータがk件以上存在する(k-匿名性を満たす)ようにデータを変換することで、特定の個人の識別を困難にしている。
今回の実証実験では、統計情報から作成した個票形式のサンプルデータ(150万件)にk-匿名化処理を実施。k-匿名化処理だけではk値を満たすことが難しい特異なデータについては、データ項目をカテゴライズするなど工夫し、k値を満たすデータを作成した。そして、そのデータを利用して基本的な人口や人口動態を分析したところ、詳細なデータ分析ではなく、割合などの傾向を分析するには、十分な精度であることが確認できたという。
また神戸市では、今回の実証実験でk-匿名化を行ったデータの1つを、より活用しやすい統計情報に集計し、オープンデータとして公開した。
神戸市では、今回の成果も参考にオープンデータ化を進め、さらなる市民サービス向上に取り組むとしている。一方の日立ソリューションズでは、クラウド上でのデータ利活用やオープンデータ化が今後も進んでいくことを見据え、プライバシー情報匿名化ソリューションのさらなるサービスの拡充を進めるとのこと。