NetApp Innovation 2011 Tokyoから学ぶストレージの最新トレンド【後編】


 ネットアップ株式会社は、2月23日に、東京・恵比寿のウェスティンホテル東京において技術者向けカンファレンス「NetApp Innovation 2011 Tokyo」を開催した。NetAppのプライベートイベントは、2008年4月に同地で開催されたNetApp Focus 2008以来だが、今回はクラウドコンピューティングの未来像を具現化するNetAppの最新テクノロジやパートナー企業との連携による高度なソリューションが披露された。

 本稿では、筆者が特に気になったエンタープライズストレージ関連のトピック、またこれらを取り巻く最新テクノロジについて取り上げる。後編では、フラッシュメモリを活用した高速化技術、そして次世代のオブジェクトベース・ストレージとして注目されているNetApp StorageGRIDを紹介していく。

 

フラッシュメモリを大容量キャッシュとして活用するFlash Cache

 近年では、ストレージへのアクセスを劇的に高速化するアプローチとしてフラッシュメモリを活用した製品が増えている。NetApp FASシステムもその代表例であり、同社は従来のHDDに代わってSSDを搭載するパターンと、フラッシュメモリをディスクキャッシュとして利用するパターンの2通りを用意している。特に興味深いのは後者であり、同社はこの大容量キャッシュ技術を『Flash Cache』と呼んでいる。

 Flash Cacheの前身は、DRAMキャッシュを搭載したPAM(Performance Acceleration Module)である。NetApp FASシステムにPAMを搭載することで、ストレージシステム内部のディスクI/Oが大幅に削減され、ストレージのデータ転送性能や応答性能が向上する。しかし、高価なDRAMベースで構成されていたため、キャッシュの効果は非常に高いものの、コストも高く付くという問題を抱えていた。

 Flash Cacheは、DRAMの代わりにフラッシュメモリを搭載した新型モジュールで、第2世代のPAMとして位置付けられる。フラッシュならではの大容量(上位モデルは最大8TB搭載可能)を生かし、特に読み出し性能を大きく高められる。NetApp FASシステムでは、Flash Cacheが新たな階層として扱われ、アクセス頻度の高いデータがFlash Cacheに保管される。完全な自動階層化機能なので、ポリシーなどの設定は不要だ。

 Flash Cacheが効果を発揮する用途には、大規模の仮想デスクトップ環境などが挙げられる。仮想デスクトップ環境では、多数のユーザーが同時にOSの起動やログインを行うことが多く、そのときに発生する大量かつ局所的なストレージアクセスによって、ユーザーの体感速度が著しく損なわれる。Flash Cacheを導入することで、ユーザーOSの起動、ログインが一気に発生するブートストームやログインストーム時にも優れた応答性能を維持できる。

 

ストレージI/Oのボトルネックを大幅に軽減するOracle 11g R2の最新機能

 多くのシステム環境では、Flash Cacheの搭載によってアクセス性能の問題はおおむね解消できるが、とりわけI/O負荷の高い用途では、先ほど取り上げた2パターンでいうところの前者、すなわちHDDの代わりにSSDを搭載するアプローチも重要になってくる。その代表例がデータベース統合である。

 午後のセッションでは、オラクルがOracle Database 11g Release 2とSSD搭載のストレージシステムを組み合わせた最新ソリューションについて解説している。サーバー仮想化技術によるサーバー統合と同様に、データベースサーバーの統合も昨今のトレンドになりつつあるが、ここで大きな問題となるのがストレージI/Oのボトルネックだ。

 通常のサーバー仮想化においても、集約するサーバー数が増えるとI/O周りのボトルネックが発生しやすいが、特にトランザクションの多いデータベースの場合、少数の集約でもこうした問題が顕在化しやすい。オラクルによれば、データベースシステムのボトルネックとなる要素のうち、全体の43%がストレージI/Oに起因するものであるという。

 このようなとき、SSDを搭載したストレージシステムが威力を発揮する。ただし、HDDをそのままSSDに置き換えただけでは費用対効果が非常に悪い。Oracle Database 11g Release 2は、Database Smart Flash Cacheと呼ばれる機能によって、特にアクセス負荷の高いデータ領域に対してのみSSDを適用する。このDatabase Smart Flash Cacheによって、少数のSSDを搭載しただけでもストレージI/Oのボトルネックを大幅に軽減できる。


アクセス負荷の高いデータ領域はSSDに保管する(出典:ネットアップ株式会社より提供を受けた資料、以下同様)。これは、NetAppがFlash Cacheとして提供している自動階層化機能をOracle Database上に実装したようなものだ

 

データベースがNFSを直接サポートすることでストレージI/Oがさらに向上

 このような極限的な環境では、NFSの処理もシステムパフォーマンスに少なからず影響を与える。通常、サーバー側ではOSカーネルまたはそれに近い部分でNFSの処理(NFSクライアント接続)が行われるが、Oracle Database 11g Release 2は、Direct NFS(dNFS)機能によって、このNFS処理をデータベースが直接行えるようにしている。

 技術セッションの中では、NetApp FASシステムを組み合わせたテスト環境で実測したベンチマーク結果が披露された。4個のインスタンス(4台のデータベースサーバーに相当)上で、システム全体で600セッションを張り、最大限のトランザクションを発生させたところ、Database Smart Flash Cacheを利用することでIOPSを7.7倍に高められた。ここで、さらにdNFSを併用することで、IOPSを13倍にまで引き上げられることも確認された。

 従来であれば、本格的なデータベース統合を行うために、何百台ものHDDを無理やり搭載したり、高額なSSDを多数搭載したりして十分なI/O性能を確保する必要があったが、Database Smart Flash CacheとdNFSを活用すれば、HDDベースのストレージシステムに少数のSSDを追加するだけで同等のパフォーマンスが得られるようになる。

 これらはOracle Database 11g Release 2の機能なので、どのベンダのストレージシステムを組み合わせても確実に効果が現れる。しかし、サーバーとストレージ間の接続に広帯域かつシンプルなUnified Connectを活用できるNetApp FASシステムは、特にデータベース統合との相性に優れたストレージシステムといえるのではなかろうか。


Database Smart Flash Cacheを有効にすることで、データベースの処理性能が飛躍的に向上する(この機能を無効にしたときと比べて約7.7倍)。これでも十分な改善と見て取れるが、CPUの負荷率が60%程度で頭打ちになっていることからも分かるように、まだ性能を高められる余地が残されている
Database Smart Flash CacheとdNFSの両方を有効にすることで、最大限に処理能力を引き出せるようになる(両機能を無効にしたときと比べて約13倍)。CPUの負荷率も90%以上に達しているDatabase Smart Flash CacheとdNFSを使用していない環境では、システム全体の処理性能が低いところで頭打ちになっているため、インスタンス(統合するデータベースの数に相当)を増やせば増やすほど、インスタンスあたりの処理性能が低下していく。これに対し、両機能を有効にした場合には、インスタンスの数に比例してリニアに処理性能が向上していく。これこそがデータベース統合の真骨頂だ

 

将来的にはクラウド間の連携によってストレージもクラウド化される

 最後のトピックとして、NetAppが現在推し進めているクラウドストレージやオブジェクトベース・ストレージの技術動向について取り上げる。今回のNetApp Innovation 2011 Tokyoでは、企業のITインフラを支えるキーテクノロジとして日増しに存在感を高めつつある『クラウドコンピューティング』が最大のテーマとなった。

 基調講演でクラウド技術の最新動向を解説した、米NetApp CTOオフィス クラウド統括担当CTOのヴァル・バーコヴィッチ氏によれば、サーバー仮想化技術を通じてサーバー統合がいっそう進み、これから5~10年以内にプライベートクラウドとパブリッククラウドの両方が企業インフラを大きく支配する存在となりうることを予測した。

 プライベートクラウドとパブリッククラウドはこれからも適材適所で使い分けられるが、近い将来にはプライベート同士、パブリック同士の連携が進み、さらにはプライベートとパブリック間の異種連携(インタークラウド化)さえも行われるようになる。

 お互いに連携しあうクラウド群が地球規模で構成されれば、物理的に遠く離れた場所にデータが分散して配置されるようになる。このとき、ストレージの側から見れば、クラウド化されたストレージ群、すなわちクラウドストレージが構成されている。

 ヴァル・バーコヴィッチ氏は、このクラウドストレージ関連の標準化作業を進めているSNIA傘下のCloud Storage Initiative(CSI)において議長(Chairman)を務めている。これは、NetAppが将来的にクラウドストレージの立役者となることを目指しているようにも受け取れる。将来のData ONTAPには、クラウド間の連携をストレージ側でも柔軟にサポートできるような機能が追加されるかもしれない。


クラウドコンピューティングの変遷。現在は、プライベートクラウドとパブリッククラウドが独立して存在するPhase 2の状態にある。将来的には、クラウド間が連携するPhase 3やPhase 4へとさらに進化していく

 

非構造化データの大量保管に向くオブジェクトベース・ストレージ技術

 近年では、データの量が指数関数的に増加している。その大きな要因として、スマートフォンやスレートに代表されるモバイル端末の普及、Facebookのようなソーシャルネットワークサービス(SNS)の興隆が挙げられる。こうしたアプリケーションによって生成されるデータは、テキストや画像、音声、動画といった非構造化データが中心となる。最近生成されたデータのうち、実に95%が非構造化データであるといわれている。つまり、ストレージに格納されるデータのほとんどが非構造化データということだ。

 NetAppは、大量の非構造化データを取り扱うストレージグリッド技術として『NetApp StorageGRID』をすでに実用化している。これは、2010年4月に買収したBycastのオブジェクトベース・ストレージ技術に基づくものだ。

 NetApp StorageGRIDは、地理的に離れたストレージシステム間で単一のコンテナを構成するソフトウェアレイヤを構成する。まず、アプリケーションから単一の巨大なデータ格納庫があるかように見せるために、グローバルネームスペースの技術が用いられる。また、ストレージグリッド内で保有するデータのコピー数、実際に保管されるストレージの場所や階層、データを保持する期間などを設定するために、各データに多様な付加情報を付けられるメタデータベース管理も不可欠だ。NetApp StorageGRIDは、こうしたグローバルネームスペースやメタデータベースの機能を包括的に提供する。

NetApp StorageGRIDのシステム構成。地理的に分散して配置された複数のサイトから、同じく分散して配置された複数のストレージシステムに対してアクセスする形がとられる。これらのストレージシステム群を単一の巨大なレポジトリのように見せるのがNetApp StorageGRIDの役割である

 

医療機関の厳しい要件にもしっかりと応えるNetApp StorageGRID

 NetApp StorageGRIDでは、Bycast時代からの顧客を引き継ぎつつ、同時に新たな市場を開拓していく。Bycastはもともとカナダの会社だったことから、現時点ではカナダや米国など、どちらかといえば北米を中心とした顧客を多く持つ。午後の技術セッションでは、米アイオワ州にある医療機関 Iowa Health Systemの事例が紹介された。

 Iowa Health Systemには、13カ所の中型・大型サイト、140カ所のリモートサイトがあり、約2万名の従業員がITシステムを活用している。同機関は、患者たちのX線やMRIなどの医療画像を数多く抱えているが、これらの医療画像はさまざまな法規制によって強く縛られている。このため、24時間/365日のアクセシビリティ、長期間の確実な保管、データの改ざんや削除防止など、かなり厳しい要件が課せられている。

 Iowa Health System は、NetApp StorageGRID(導入当初はBycast StorageGRID)を利用して地理的に離れた2カ所のデータセンターに大量のデータを分散配置している。その優れた堅牢性は、2008年に発生したシーダーラピッズ(Cedar Rapids)の洪水によって示されることとなった。

 この洪水によって、プライマリDCが運用を継続できない状況に陥ったが、セカンダリDCへのフェイルオーバーが数分で完了し、業務をそのまま継続することができた。また、災害が収まってプライマリDCが復旧した際には、自動的なデータ再同期が行われ、速やかに通常稼働へと戻っている。

 

Data ONTAP 8 とNetApp StorageGRIDで全方位に対応する戦略

 NetApp StorageGRIDは、これからますます重要性が増す大量データのレポジトリにおいて威力を発揮する次世代ソリューションとなる。以前からある一般企業のニーズはNetApp FASシステムとData ONTAP 8の7-Modeを組み合わせたソリューションで、HPC市場向けにはC-Modeを採用したスケールアウト型のソリューションで対応し、大量データのレポジトリはNetApp StorageGRIDで新たな顧客を獲得するという戦略だ。

 どのベンダも将来的にパイが広がりそうな市場には大変敏感であり、大量データのレポジトリとして活用できるオブジェクトベース・ストレージ技術は、いくつかの企業において精力的に開発が進められている。例えば、EMC Atmos、DataDirect Networks(DDN)のWeb Object Scaler(WOS)、DellとCaringoの技術提携によるDell DX6000シリーズなどが代表例として挙げられる。実は、これらのうち1社の取材をすでに済ませており、近日中にオブジェクトベース・ストレージに関する記事をあらためて寄稿する予定だ。

NetAppは、Data ONTAP 8の7-ModeとC-Modeに加え、StorageGRIDを新たに組み合わせることで、さまざまな顧客のニーズに対して全方位で応える戦略をとる

 

 以上、NetApp Innovation 2011 Tokyoで学んだストレージ関連の最新トレンドを2回にわたってお届けしてきた。NetApp Innovation 2011 Tokyoでは、最新のストレージ技術に関する情報を収集できる貴重な場となったが、それと同時にストレージ業界がこれから歩んでいくであろう将来のロードマップも示されていたように思う。

 ここ数年前あたりまでをさかのぼると、めまぐるしく進化するコンピュータ業界にありながら、ストレージ関連の技術や製品は比較的緩やかに進化を遂げてきた。しかし、これからますます重要性が増すクラウドコンピューティングの興隆によって、ストレージ側の進化も一緒に加速されそうな気配を感じている。

関連情報