富士通研、人気データへのアクセス集中によるレスポンス低下を自動解消する新技術


 株式会社富士通研究所は30日、分散ストレージにおいて人気データへのアクセス集中を自動的に解消してユーザーのアクセス時間(レスポンス)の悪化を抑える技術を開発したと発表した。

 昨今、膨大なデータの蓄積に分散ストレージが広く利用されている。分散ストレージは複数のサーバーを組み合わせて1つのストレージ装置とする。サーバー台数を増加させることでストレージ容量や性能を増強できるため、日々増加していくようなデータの格納に適している。また、同じデータの複製(レプリカ)を複数のサーバーが同時に持つことでデータの信頼性とアクセス性能を高めている。

分散ストレージ

 しかし、格納された特定のデータへのアクセスが極端に増加すると、そのデータを持つサーバーの負荷が増大し、ユーザーのアクセス時間が著しく長くなる場合があった。

人気データへのアクセス集中による性能低下

 今回開発したのは、突発的に人気が出たデータを即座に検出し、そのレプリカを増やすことでサーバーへのアクセスを自動的に平準化させる技術。従来人手で対応していた性能低下の解消を自動で対処し、ユーザーのアクセス時間悪化を抑えられるという。

レプリカ数を適切に増減させる技術

 実際の効果については、インターネット上で実際に起きた、ある有名ポップスターの大ニュース発生時の大規模なアクセス集中を模したデータを使い、64台のサーバーで検証。サーバーごとなくせ素頻度の変化を時刻ごとに調べると、従来の方式では関連したデータを持つサーバーのみにアクセス集中が起き、そのアクセス頻度の増加率は約2.3倍だった。ところが同技術を適用すると、アクセス頻度の増加率は0.7倍まで平準化され、アクセス集中を約70%削減できたとしている。

従来方式におけるアクセス集中時の各サーバへのアクセス頻度の変化本技術適用によるアクセス集中時の各サーバへのアクセス頻度の変化
関連情報
(川島 弘之)
2012/7/30 14:20