ニュース
富士通研、ディスクの多重故障に対応した高速リカバリ方式を開発
(2014/10/6 07:00)
株式会社富士通研究所は6日、ディスクの多重故障に対応した高速リカバリ方式を開発し、RAIDによる従来システムに比べて、故障復旧時間を20%以上短縮することに成功したと発表した。同リカバリ技術を2015年度中にも実用化して、同社のストレージ製品に組み込み、提供する予定だという。
ニュースや株価、動画、静止画、音楽といった参照のみに使われるコンテンツデータは年率70%増で増加する一方、大量のコンテンツが消失するリスクにも注目が集まっており、コンテンツプロバイダーなどでは、それに向けた対策が課題となっている。一般的には、コンテンツデータの消失対策として、三重コピー方式を用いている例が多く、それを効率的に行うためにRAID 5/6といった技術を用いているケースが多い。
富士通研究所 ICTシステム研究所 データプラットフォーム研究部の塩沢賢輔主任研究員は、「処理が単純な三重コピーの場合、結果としてデータ量の3倍以上のディスク容量が必要になる。一方で、RAID6では、全データを2つのパリティ(冗長データ)で一括保護するために、三重コピーでは33%だったディスクの容量効率を75%と2倍以上の改善が図れる。しかしRAID方式では、パリティに加えて、消失していないすべての残存データを用いて消失したデータを復旧するため、大量のデータ転送が発生し、復旧が長時間化するといった点が課題となっている。今回の技術は、これを解決するものになる」と説明する。
同社によると、毎秒15MBのランダムI/O性能で、4TBの容量のディスクを48個用いた場合、二重障害の復旧に10時間以上かかるという。
「復旧時間が長時間化することで、復旧中のデータ消失リスクの時間が増加するほか、サービスを停止しなくてはならない時間が増加するといったことにもつながる」(塩沢主任研究員)といった点も問題となっていた。
今回開発した技術では、各パリティが保護する範囲を多層化。それぞれのパリティは一部のデータに限定して保護し、その上で、すべてのデータは多重のパリティによって保護するほか、多重故障からも普及できるように保護範囲を一部重ねあわせるという。
こうした仕組みを構築した上で、データが消失した場合には、復旧に必要にデータおよびパリティが最小になるように選択。復旧に必要がないデータは復旧処理には使用しないため、データ転送が不要になり、その分だけ短時間で処理ができるという。
「二重障害を想定した実機による実験では、4TBディスクを48個用いたシステムで、従来のRAID技術に比べて20%以上の復旧時間の短縮が可能になった」という。
さらに、同リカバリ技術では、データ数や保護範囲、パリティ数を柔軟に変更できるため、当該システムにおける最適な構成を確立。「容量効率、復旧性能、信頼性というトレードオフの関係にある3つの特性に応じた構成が可能になる。容量効率を追求したいユーザー、短時間での復旧を優先するユーザーといったように、要求にあわせて保護範囲やパリティ数を可変できる」としている。
この構成を変えることで、さらなる復旧時間の短縮も見込まれ、「従来のRAIDでの復旧に比べて、30~40%の復旧時間短縮が図れる可能性もある。今後の検証のなかで実証していくことになるが、これにより、ニーズにあわせた最適解を提案できるようになる」(富士通研究所 ICTシステム研究所データプラットフォーム研究部の赤星直輝部長)と語った。
富士通研究所では、2015年度中の実用化に向けて改善を加える予定だが、「実用化に向けては、技術的な課題解決というよりも、復旧性能、容量効率、信頼性といった3つのバランスの検証が重要。ユーザーごとに、データの重要度にあわせて提案できるリコメンデーション型のメニューを用意したり、またはコンサルティングサービスのような形で提案するための検証データや仕組みを用意することになる」(塩沢主任研究員)とし、今後はパリティ保護範囲の構成支援などに向けた検証に、力を注ぐ予定だ。
実用化においては、富士通のストレージに組み込んで提供することになるが、技術的にはソフトウェア製品として切り出して事業化することも可能だという。
同社では、クラウドサービスやWebサービスでコンテンツを提供する事業者などで効果を発揮する技術だとしている。
なお同技術は、10月5日(現地時間)に米コロラドで開催された国際学会「USENIX HotDep'14」で、学会発表された。