ニュース

富士通研究所、暗号化したデータを秘匿検索可能な技術を開発

医療、教育分野でのプライバシー保護に寄与

 株式会社富士通研究所は15日、暗号化した文字列データをそのまま検索可能な秘匿検索技術を、業界で初めて開発したと発表した。

 富士通研究所では、2013年8月に、データを暗号化したまま統計計算や生体認証などを可能にする「準同型暗号」の高速化技術を発表しており、新たな秘匿検索技術は、この技術をベースに、一回の処理で複数の暗号演算を同時に行えるように改良。すべての文字列データに対して、暗号化した検索キーワードが一致するかどうかを一括判定する方式を新たに開発した。これにより、1万6384文字の検索を1秒で行えるという。なお、扱う文字数に応じて、処理時間は増減することになる。

 また、文字列データや検索キーワードだけでなく、検索がヒットしたかどうかも秘匿するため、秘密鍵を持つ検索者にしか検索結果がわからないようになっている。これにより、アウトソーシングの環境においても、機密データの検索を安全に行うことができる。

 「クラウドやビッグデータ分析など進展に伴い、機密データ利活用とプライバシー保護の両立が大きな課題となっている。また、健康管理をはじめとする個人に特化した情報サービスが登場するなか、個人のプライバシーデータの漏えいなどの問題も増加している。富士通研究所では、プライバシーを保護すると同時に情報を活用するための技術開発を行ってきたが、クラウド環境上でさらに情報を利活用するには、統計演算だけでなく、暗号データのまま安全に検索処理できる技術が必要である。今回発表した新たな技術によって、DNAや生化学、医療、教育などのプライバシーの高い情報を、暗号で、安全に守りながら検索が可能になる」(富士通研究所 ソーシャルイノベーション研究所セキュアコンピューティング研究部・小暮淳主管研究員)とする。

クラウド上でデータを復号するには、プライバシー面などで課題があるという
富士通研究所 ソーシャルイノベーション研究所 セキュアコンピューティング研究部の小暮淳主管研究員

 これまでにも文字列を暗号化したまま検索する方法はいくつかあったが、あらかじめ検索キーワードを登録しておく必要があり、自由に検索できないという課題があったほか、検索結果が暗号化されずに検索サーバーに漏れてしまう、処理に時間がかかるといった課題もあった。

 新たな技術では、暗号化文字列の一致判定技術によって、検索ワードの事前登録を不要にし、任意のワードでの検索を可能にしたほか、準同型暗号を利用することで、検索開始時点から、結果出力まで暗号化状態を保つことができる。

 また、これまでは文字列が一致するかの判定を一文字ずつずらしながら行っていたが、全体を一括して計算する手法を開発することで、秘匿検索処理を飛躍的に高速化できた。

 「不一致文字数計算の繰り返しによる検索時間の増大という課題に対応するため同時実行という手法を取り入れた。不一致文字数計算の肝となる内積計算に着目し、高速化を実現。一回の多項式乗算によって、成分をずらした内積値がすべて出現するという多項式乗算の性質を利用し、すべての内積計算を同時に実行する仕組みを採用した」(小暮主管研究員)という。

文字列計算の仕組み
実用化に向けた課題とポイント

 新技術の具体的な利用例として、DNAに含まれる塩基配列の検索に応用することで、患者のDNA情報を暗号化で秘匿したまま、特定の配列パターンが含まれているかを調べることが可能になったり、さまざまな病院から集めた病歴や塩素配列をすべて暗号化したまま新しい分析結果を得ることで、新薬の研究開発の効率化や最適な治療方法の創出など、医療分野における研究開発の促進につなげることができるなどとした。

 そのほか、複数の教育機関が合同で成績情報を分析する場合などにも、プライバシー性の高いデータの検索を、より安全に行うことが可能になる。

 富士通研究所では、2015年の実用化を目指して、実証実験などを進めていく考えだという。

医療研究機関での適用例
暗号化されたデータに対して、暗号化した検索ワードで検索するデモストレーションの様子

大河原 克行