クラウド&データセンター完全ガイド:プロダクトレビュー DCを支える黒子たち

前モデル比2倍の性能を実現した“第3世代”モデル

Pure Storage FA-400シリーズ

開発:Pure Storage, Inc./販売:東京エレクトロン デバイス株式会社

東京エレクトロンデバイスは、2013年6月7日から、米Pure Storageの最上位機種「FlashArray FA-400シリーズ」の国内販売を開始した。米本社でも5月29日に出荷開始されたばかりの最新製品で、ほぼ間を置かずに国内導入された形だ。既存製品であるFA-300シリーズとの比較では、最大容量とアクセス性能が共に2倍に引き上げられた。FlashArrayを制御するソフトウェアも「Purity 3.0」にバージョンアップをはたしており、同社ではFA-400とPurity 3.0の組み合わせを「第3世代オールフラッシュアレイ」と表現している。

フラッシュの高速I/OをHDDのコストで実現

Pure Storageは、昨年相次いで市場デビューを果たした「オールフラッシュストレージ」のベンダーのなかでも、コストパフォーマンス重視の姿勢を鮮明にしている。同社のFlashArrayシリーズは、汎用的なHDD互換のフラッシュドライブを採用し、インラインでの重複排除やデータ圧縮をソフトウェアで実現することによってフラッシュドライブのギガバイト単価の高さをカバーし、HDDと同等レベルの容量単価を実現したという。

最新モデルとなる「FA-400シリーズ」は、ハードウェアの強化とソフトウェア(ストレージOS)の強化を同時に実現したことで、前モデルであるFA-300シリーズに比べて、アクセス性能(IOPS)と最大容量のいずれも2倍に引き上げた。

ポイントは、インラインで重複排除処理を行うことで、これによって物理容量の数倍の論理容量を確保している。HDDに比べてパフォーマンス面で大きなアドバンテージがあるフラッシュドライブでは、重複排除の処理がパフォーマンスの劣化要因にならないからこそ可能になったものだ。とはいえ、Pure Storageが「容量単価がHDDと同等」という場合、重複排除後のフラッシュドライブの論理容量とHDDの物理容量との比較であることには注意が必要だ。具体的には、FA-400シリーズの最大容量は約100TBとされているが、これは重複排除による容量圧縮率を5分の1としたもので、物理容量では最大23TBとなる。なお、FA-300シリーズの最大物理容量は11TBだったので、前モデル比で容量2倍というのは文字通りの正確な値となる。

FA-400シリーズの特徴

新製品の「FlashArray FA-400シリーズ」では、処理性能と物理容量がそれぞれ2倍に向上している(図1)。前モデルとなるFA-300シリーズは、コントローラーのプロセッサとしてインテルの6コアプロセッサ(Westmereコア)×2を搭載し、ワーキングキャッシュとして96GBのDRAMを用意していた。一方、FA-400シリーズでは、プロセッサがインテルの8コアプロセッサ(Sandy Bridgeコア)×2にアップグレードされ、ワーキングキャッシュも2倍以上の256GB DRAMに増強されている。ソフトウェアの実効性能という観点で性能が2倍になっているのも納得できるだろう。逆に、そのほかの外形寸法やポート数といった物理的な諸元はほぼ同一で、唯一アップグレードされたのが、コントローラー間接続用に2ポート用意されているInfiniBandが40Gbpsから56Gbpsにアップグレードされている点が違いとなる。

図1 FA-300とFA-400の違い(出典:東京エレクトロンデバイス)
写真1 Pure Storage FlashArray FA-400シリーズ(出典:東京エレクトロンデバイス)

コントローラーは、2Uサイズのラックマウント筐体で、重量20kgという点もFA-300シリーズと同様だ(写真1)。

ストレージシェルフには、「基本シェルフ」と「拡張シェルフ」がある。いずれも2Uサイズで、基本シェルフは物理容量2.75TB~5.5TB、拡張シェルフは物理容量12TBとなる。このため、最大容量で構成する場合、FA-300では基本シェルフ2台、FA-400では基本シェルフ2台と拡張シェルフを1台接続する形になる。フラッシュドライブは、基本シェルフでは256GBのMLC SSD 22台とNVRAM2台で構成されており、2.75TBまたは5.5TBを選択できる。拡張シェルフでは24台の512GB MLC SSDを搭載する。いずれも冗長化された2台のホットスワップ可能な電源を搭載する。

FA-400の最大物理容量がFA-300の2倍に増加したのは、ソフトウェア側の対応もあるかもしれないが、直接的には従来の倍の512GBドライブが使えるようになったためとみられる。

FA-400シリーズの参考価格は、最小モデルで2,100万円からとなっている。

ソフトウェアで実現するストレージ

ストレージの主役は、記憶メディアであるHDDやSSDから、ストレージソフトウェアに移りつつある。もちろん、記憶メディアなしでストレージが成立するわけではないのだが、競合他社と同じコモディティ化されたハードウェアコンポーネントを使っているだけでは、競合製品と差別化できる余地もなくなる。Pure Storageの場合はそうしたトレンドに積極的に対応しており、ソフトウェアの機能によってハードウェアを補うことで高度な機能を低コストで実現する、という方向性を打ち出している。

FA-400シリーズに組み込まれる形でリリースされた最新のストレージOS「Purity 3.0」では、「活性保守、ソフトウェアアップグレード、容量・コントローラー拡張によりゼロダウンタイムを実現」「保存データに対して256bit AES暗号化をサポート」「独自のスナップショット機能“ZeroSnap”が機能拡張され、VMwareのストレージAPI“VAAI”に対応。xCopyによる迅速なVMクローニングを実現」「OpenStack CINDER向けドライバをリリース。OpenStack環境でのFlashArray管理の自動化を実現」などの機能拡張が行われている。

特に同社製品の特徴となっているのがデータ容量削減にかかわる技術だ。インラインで重複排除、データ圧縮、シンプロビジョニングを実行し、これらを組み合わせることで、物理容量の5~10倍の論理容量を使用可能としている。これは、アクセス性能は高速だがまだギガバイト単価がHDDの数倍になるうえ、ドライブ当たりの最大容量はHDDの数分の1程度、という現状のSSDのメリットを活かして、デメリットを隠蔽するための周到な戦略だといえる。重複排除を行う際のデータブロックサイズは、一般的には4KBだが、Pure Storageでは512バイト単位での重複排除を行っている。この結果、より多くの重複データを見つけ出すことが可能になるが、半面処理量は増大し、重複情報を保持しておくためのメタデータ領域も大量に必要になる。つまり、重複排除のためにより多くのリソースを投入できればより大きな効果が得られるというわけで、同社ではここに戦略的に取り組んでいるわけだ。結果として同社では4KBデータブロックを使用する一般的な重複排除機能と比較して、重複排除効率が3~5倍に向上しているとしている。

さらに、SSDの弱点としてデータの書き込み/書き換えの耐用回数に上限があるという問題もあるが、重複排除とデータ圧縮によってSSDに書き込むデータ量を削減することで長寿命化にも寄与するという。

昨年から一気に製品のバリエーションが拡大し、HDDを完全に置き換えることも視野に入ってきたSSDストレージだが、Pure Storageのアプローチは、SSDの容量単価の高さをカバーしてHDDと同列に比較検討できるようにするというものだ。こうすることでHDDに対するSSDの優位が際立つことになる。

VDIやビッグデータ処理など、HDDベースのストレージがボトルネックになることもあるため、多くのデータセンターではSSDストレージの導入は、サーバー数の削減に貢献するなど、大きなメリットをもたらすことになるはずだ。

図2 The Purity Operating Environment 「Purity」のコアであるFlashCareは、複数のSSDを1つの大きい統合リソースプールとして仮想化することによりMLC SSDの寿命を延ばし遅延の一貫性を改善する。(出典:東京エレクトロンデバイス)