クラウド&データセンター完全ガイド:プロダクトレビュー DCを支える黒子たち

I/O性能向上を追求した「フルスタックコンバージドインフラ」――Datrium DVX

弊社刊「クラウド&データセンター完全ガイド 2018年春号」から記事を抜粋してお届けします。「クラウド&データセンター完全ガイド」は、国内唯一のクラウド/データセンター専門誌です。クラウドサービスやデータセンターの選定・利用に携わる読者に向けて、有用な情報をタイムリーに発信しています。
発売:2018年3月30日
定価:本体2000円+税

さまざまな機能を統合可能なCI

 米デイトリウム(Datrium)は2012年に米ヴイエムウェア(VMware)とデータドメイン(Data Domain)の出身者5人が創業したコンバージドシステム(CI)製品ベンダーだ。米国内ではすでに大手企業を含む約300社がユーザーとなっている。その同社が2018年2月14日に日本法人、デイトリウムジャパン合同会社を設立した。

 同社の「Datrium DVX」(写真1)は、プラットフォームソフトウェア「DVX Software」、サーバー「DVX Compute Nodes」、ストレージ「DVX Data Nodes」の3つを提供する。仮想化ソフトウェア/ハイパーバイザーは提供しておらず、ユーザーが好みのものを選ぶかたちだ。現在サポートされているのはvSphere、KVM、Dockerの3種類だ。加えて今後、Hyper-Vがサポートされる予定だ。

写真1:Datrium DVX(出典:デイトリウムジャパン)

 CIを構成するために必須なのはDVX SoftwareとDVX Data Nodesで、サーバーは他社の製品でも構わない。米デイトリウムの製品マネジメント担当バイスプレジデント、レックス・ウォルター(Rex Walters)氏は「一定以上の性能とSSDがあれば、やや古いサーバーであれブレードサーバーあれ、何でも動く。複数のベンダーが混在していても問題ない」と説明する。

 DVXという名称の由来だが、ウォルター氏によると、Dはdistributed(分散)、Vはvirtual(仮想)で、最後のXが「何にでも適応する」という意味が込められているという。デイトリウムが分散・仮想化できる対象として、コンピュート、ストレージのほか、データ管理、データ保護、WAN最適化、暗号化、ファイルシステム、クラスタ管理、DR(災害復旧)、キャッシュ管理などを挙げている。

3層からCI/HCIへの進化とDatrium DVXの「横の統合」

 2000年代初頭まで主流だったサーバー、ストレージ、ネットワークの3層アーキテクチャでは、個々に機器の選定・調達・設定・検証が必要だった。そこで、3層を垂直統合して一連の作業を簡略化する狙いをもったのがCIだ。仮想化環境も含めて事前設定された構成で検証済み、置けば動くという利便性を提供した。

 次に登場したハイパーコンバージドインフラ(HCI)は、サーバー内蔵のストレージをSDS(Software-Defined Storage)によって複数台のストレージを仮想統合するアプローチで集約度をさらに高めたものだ。サーバーを追加するだけでITインフラをスケールアウトできる簡便性がメリットとなる。

 では、CI/HCI製品分野におけるDatrium DVXの特徴はどこにあるのか。ウォルター氏は同製品を「フルスタックコンバージドインフラ」と呼んで次のように説明する。

 「一般的なCI/HCIは単にハードウェアを集約することで利便性を追求した統合アプローチを取っている。一方、Datrium DVXは、ハードウェアというより“用途”を統合する。いわば、縦の統合ではなく、横の統合のアプローチだ」

 ウォルター氏の言う用途とは、コンピューティング、プライマリーデータ、セカンダリーデータ、オフサイトの4つ。Datrium DVXでは、プライマリーデータはサーバー内のSSDにキャッシュとして保持される。このキャッシュはライブデータだが、同時にセカンダリーデータとしてDVX Data Nodesにもコピーされ、データ保護の重要度に応じてオフサイトにもコピーされる。この4カ所のデータに対して、DVX Softwareがグローバルネームスペース、暗号化、分散システム管理、重複排除・圧縮・データ管理の各制御を担うという仕組みだ。仮想化ソフトウェアにビルトインされたDVX Softwareは、ユーザーが使い慣れた仮想化ソフトウェアの管理画面となる(画面1)。

画面1:DVX Softwareの管理画面(出典:デイトリウムジャパン)

100%キャッシュをはじめとする複数の機構でI/Oを高速化

 デイトリウムがアピールするDatrium DVXの最大の差別化ポイントはパフォーマンスだ。ウォルター氏は次のように説明する。「仮想化環境でパフォーマンスが頭打ちになるのはI/O性能不足の場合が多い。I/O性能を上げるには、データをできるだけアプリケーションの近くに置くこと。Datrium DVXは常時サーバー内のSSDに100%キャッシュを持つので、I/Oのレイテンシーが発生しない。さらに、重複排除や圧縮でI/Oを効率化している」

 また、データ保護はセカンダリーデータで行い、プライマリーデータではRAIDやイレージャーコードなどのデータ保護手法を用いない。このため、オーバーヘッドもゼロとなる。

 このほか、プライマリーデータに各サーバーが保持するキャッシュのメタデータを一括管理し、サーバーがダウンした場合にはセカンダリーデータから高速にリロードする機能を備える。vMotionなどで仮想マシンを移動した場合に、キャッシュからキャッシュへのコピーも可能だ。

 セカンダリーデータを格納するDVX Data NodesはHDDとSSDを搭載でき、時間を設定したスナップショット(3000個)を取得する。こちらには分散型イレージャーコーディングや2重障害対応などのデータ保護機能が備わる。

 サーバー上のどの箇所が故障しても、データは必ずDVX Data Nodesにあるのでデータ損失の心配はない。一方、サーバーはステートレスに稼働し、サーバー間のネットワークトラフィックが発生せず、故障の影響が他のサーバーに及ぶこともない。

 スナップショットはオフサイトにレプリケーションできるが、重複排除・圧縮によって、コピーサイズは軽量だ。別ロケーションのDSX Data Nodesをレプリケーション先にする場合は、DVX Softwareから管理できる。AWS(Amazon Web Services)へのレプリケーションにも対応し、こちらはオプションのソフトウェア製品「Cloud DVX」を用いることで行える。

サーバー/ストレージの両拡張でパフォーマンスが向上する仕組み

 Datrium DVXの最小構成はサーバー1台とDVX Data Nodes1台で、最大でサーバー128台、ストレージ10台/1.6PBまで拡張できる。拡張する場合は、コンピュートリソースが不足したらサーバーを追加し、データが増えてストレージリソースが足りなくなったらDVX Data Nodesを追加する。サーバーを増やせば、当然コンピュート性能が上がるが、ストレージ性能にかかわるリードパフォーマンスも向上する。また、DVX Data Nodesを増やすと、保護できるデータの量が増えるだけでなく、ライトパフォーマンスも向上する。

 暗号化や重複排除、圧縮を常に行っているため、CPUの負荷が心配になるが、「CPUの利用は20%にキャッピングしている。I/O性能要求の高いアプリケーションの場合は、40%まで拡大可能」(ウォルター氏)だという。そもそもシステムの目的はアプリケーションを動かすことなので、そのためにコアを増やした場合は、Datrium DVXが使用するCPUをリニアに増やさず、特定のコア数に対して20%というキャッピングを行う。

 「暗号化・重複排除・圧縮のすべてが常にオンの状態でも、パフォーマンスが落ちず、高速なI/O性能を実現できるのがDatrium DVXのアドバンテージだ」(ウォルター氏)