ニュース

ピュア・ストレージ、メタデータのボトルネックを解消する新たなデータストレージ基盤「FlashBlade//EXA」

 ストレージベンダーの米Pure Storageは、米国時間の3月11日に、AIやHPC(高性能コンピューティング)のワークロードに向けて、メタデータをデータ本体と分離して扱うデータストレージプラットフォーム「FlashBlade//EXA」を発表した。一般提供開始は2025年夏を予定している。

FlashBlade//EXA

 日本においてもピュア・ストレージ・ジャパン株式会社(ピュア・ストレージ)が、日本時間の3月12日に記者説明会を開催。Pure Storageのアジア太平洋・日本地域担当VP 兼 CTOのマシュー・ウーストヴィーン氏が、FlashBlade//EXAについて説明した。

FlashBlade//EXA
Pure Storage アジア太平洋・日本地域担当VP 兼 CTO マシュー・ウーストヴィーン氏

メタデータノードをデータノードから分離して性能やスケーラビリティを向上

 ここでいうメタデータとは、ウーストヴィーン氏によると、例えばAI学習でのアノテーションによるタグのようなものを指す。こうしたメタデータは、データ本体と比べると、サイズの小さいデータが大量にあるのが特徴だ。

「例えば、銀座で車を運転している動画に対して、物体検出のバウンディングボックスがメタデータとして大量に作られる。動画ファイルは1本の大きなファイルだが、メタデータは多数の小さなファイルになる」(ウーストヴィーン氏)。

 こうしたメタデータをデータ本体と一緒に扱う従来のストレージシステムでは、拡張性の問題や、メタデータのI/Oでのボトルネックが生じていたと、ウーストヴィーン氏は説明する。

 そこでFlashBlade//EXAでは、メタデータノードをデータノードから分離した。メタデータノードのFlashBlade//EXAがメタデータを処理するエンジンとなり、データノードには既成のストレージ製品を使う。そして、単一の管理プレーンから、メタデータノードとデータノードを一元的に管理する。

 これにより、メタデータノードとデータノードの容量や性能をそれぞれ独立して拡張できるようになる。そして、データ本体のような大きなファイルから、メタデータのような小さなファイルまで、並列で処理できる。またFlashBlade//EXAでは、大量の小さなメタデータを効率よく扱えるよう、ソフトウェアをファインチューンしているという。

 メタデータノードによるメタデータコアは分散型アーキテクチャとなっており、メタデータの制御やシステムプロセスが全体に分散している。

メタデータノードをデータノードから分離
FlashBlade//EXAのアーキテクチャ

 FlashBlade//EXAでは、単一のネームスペースでの読み取りで毎秒10TB以上の性能を持つ。さらに「よくあるデータサイエンティストチームの不満の1つは、ネームスペースのサイズ」(ウーストヴィーン氏)ということもあるため、、単一のネームスペースで、従来の20倍以上のファイルを処理できるようにした。

 製品スケジュールとしては、顧客による受け入れテストをアジア太平洋地域や日本を含む世界各地域で実施中。一般提供開始は夏(6月)を予定している。

 その後のロードマップとしては、メタデータノードで使われているDFM(Direct Flash Module)技術によるデータノードを開発中。さらに、NVIDIAの認定取得や、Storage as a ServiceのPure Fusionへの統合も計画しているとウーストヴィーン氏は語った。

FlashBlade//EXAのパフォーマンス
製品ロードマップ