ニュース

富士通研究所、データベースと検索内容を暗号化したまま照合できる秘匿編作技術を強化

 株式会社富士通研究所は16日、データベースと検索内容を暗号化したまま照合できる秘匿検索技術を強化し、暗号化されたデータベースから元データの類推を防止することで、より安全に照合できる技術を開発したと発表した。

 パーソナルデータや機密データを安全に扱うための技術としては、データベースに登録するデータと利用者側が入力する検索文字列を、暗号化したまま照合できる秘匿検索技術があり、鍵を持つ利用者だけが検索文字列に対応したデータベースの登録数を参照することが可能となる。

 しかし、たとえば医療分野では、公的機関や医療機関が公開している病名や医薬品などの統計情報と、データベースに登録されている件数を突き合わせることで、暗号化したデータベースであっても、そのデータの内容を類推できてしまうという問題があった。さらに、データベースの内容が類推できてしまうと、検索文字列が暗号化されていても、検索結果から利用者が何を検索したのかも推定できてしまう。

従来の秘匿検索技術による医療データの利活用イメージ

 今回開発した技術は、データベースに最小限のダミーデータを追加することで、データベース上の登録数を攪乱し、元データの類推を防止する。

 たとえば、病名、医薬品、血液型といったデータの項目ごとにグループを作り、そのグループごとにダミーデータを入れていく。各グループ(例::血液型)の要素(例:A型、B型、O型、AB型)の数がそれぞれ均一になるようにダミーデータを登録していくことで、それぞれの要素がデータベース上ではすべて同じ数で出現し、類推をすることができなくなる。

 グループ内の要素の数が均一になるように、グループごとに最小限の数のダミーデータが作成されるため、データ量の増加を抑えることができる。検索結果に含まれるダミーデータの件数は、独自のルールで作成されたフラグを照合することで容易に除外できるため、利用者には処理された後の正しい検索結果が提供される。

開発したデータの類推を防止する技術

 この技術を活用し、2000項目からなる診察記録10億件をデータベースに登録したところ、データ量の増加を元データの9倍以内に抑え、統計情報と登録数が一致せず類推できない状態で照合ができることが確認できたと説明。技術を医療分野に活用することで、電子カルテなど機密情報をクラウド上で共有し、登録情報や検索内容を秘匿したまま、製薬会社がデータベースでの登録数を安心して照合できるため、新薬開発の効率向上が期待できるとしている。

 また、技術は医療分野に限らず、公共分野におけるデータを基にした自治体の街づくりや、金融分野の顧客データのマーケティングなどに応用できると説明。今後は、データの匿名化技術やプライバシーリスクの評価技術など、富士通株式会社や富士通研究所のセキュリティー技術と組み合わせて提供していくことを検討していくとともに、まずは医療分野においてデータ利活用の実証実験から検証を進め、2020年度までに医療情報のデータ利活用ソリューションの実用化を目指すとしている。