日本IBMエバンジェリストに聞く、エンタープライズストレージの最新動向

ストレージの効率運用にはプール化とシンプロビジョニングの組み合わせが重要


 筆者がかつて本誌(旧Enterprise Watch)で展開してきたストレージ専門の連載(伊勢雅英のストレージ最前線)では、実用化されて間もない新技術を含め、エンタープライズストレージのさまざまな技術動向を追ってきた。そのような新技術の中で最近とりわけ普及したと思われるのがストレージ仮想化技術である。

 今回は、今から7年ほど前にストレージ仮想化の仕組みやそのメリットについてお話しいただいた日本アイ・ビー・エム株式会社(以下、日本IBM) システム製品テクニカル・セールス ストレージ・テクニカル・セールス ソリューション担当部長 システムズ&テクノロジー・エバンジェリストの佐野正和氏に再取材をお願いし、ストレージ仮想化技術で中核となるプール化とシンプロビジョニングの活用方法について詳しくお聞きしてきた。

 

ストレージ仮想化技術によってサーバーとストレージ間を論理的に切り離す

日本IBM システム製品テクニカル・セールス ストレージ・テクニカル・セールス ソリューション担当部長 システムズ&テクノロジー・エバンジェリストの佐野正和氏

 かつてのコンピュータシステムを振り返ったとき、当時は少数の大型サーバーにディスクストレージやテープストレージなど、少数のストレージシステムが接続されるアーキテクチャがとられていた。サーバーが周辺機器を全面的に管理していたことから、ストレージシステムはひたすらサーバーに対して受け身で動いていればよかった。

 しかし、サーバーの数は年々増えつつある。もちろん、物理的なサーバー数やその占有スペースは、ブレードサーバーやサーバー仮想化技術などの登場によって縮小する方向に向かっている。ところが、実際にOSが稼働している論理的なサーバーの数は、サーバー仮想化技術によって逆に増えているのだ。つまり、多数のサーバーが少数のストレージを利用する形へと変ぼうし、これまでに見られたサーバーとストレージ間の主従関係がほとんど崩れてしまっている。

 こうなると、サーバーがストレージシステムを直接管理することは事実上困難であり、両者を切り離していく方向へと向かっていくしかない。両者を切り離すには、サーバーに物理的なストレージシステムを見せるのではなく、データを保管する『器』という論理的な姿だけを見せるようにすればいい。これこそが、近年急速に普及しつつあるストレージ仮想化技術の考え方である。

 そして、多数のサーバーから少数のストレージシステムを効率よく利用するためには、ストレージリソースをいったんプール化し、そこからサーバーごとに必要な容量を切り出していけばよい。プール化という言葉の意味は少々分かりづらいが、日本人に分かりやすく例えるなら『大浴場』のようなものを思い浮かべればよい。これは、たくさんの客を入れるために、小さな風呂おけを数多く用意するのではなく、巨大な大浴場を1つ用意することで水の総量を節約しようという発想だ。


ストレージプール化の説明図(出典:日本アイ・ビー・エム株式会社、以下同様)。ストレージ仮想化技術によって、サーバーから見えるストレージシステムの物理的な姿を隠ぺいする。さらに、ストレージシステム上のディスクスペースをすべてプール化し、この巨大なプールから用途ごとに必要な容量を切り出していく

 

複数のストレージプールを階層管理することでデータの最適配置を実現する

 最も効率に優れているのは、システム全体でストレージプールを1つだけ用意することである。しかし、これを先ほどの大浴場に例えれば、特別な客も一般客も同じ浴槽に入れるようなものだ。コンピュータの世界でも、データの重要度が高いものもあれば低いものもある。また、アクセス頻度の高いものもあれば低いものもある。これらを同一のストレージプールでまかなうのは望ましくない。

 例えば、重要度の高いデータに合わせたストレージプールだけの場合、データ全体の保管コストが大きく膨れあがってしまう。逆に、重要度の低いデータに合わせたストレージプールだけの場合、今度は重要なデータの安全性を十分に担保できなくなってしまう。

 そこで、現実世界のシステム環境では、データの重要度やアクセス頻度に合わせて複数のストレージプールを階層的に用意する形がとられている。階層化された複数のストレージプールにデータを分散して配置することにより、データを適材適所で配置できるようにするのだ。ストレージ階層の数を増やせば増やすほど最適配置のレベルは高まるが、逆にコストの増大や保管効率の低下を招く。このため、「多くても10種類、常識的には2~3種類のストレージ階層に抑えるのが現実的な落としどころ(佐野氏)」となる。

 例えば、昨年10月に発表されたIBMの最新ミッドレンジ製品『IBM Storwize V7000』では、アクセス性能を重視したストレージプールにはSSD(Solid State Drive)、アクセス性能と保管コストのバランスを考慮したストレージプールには2.5インチのSAS(Serial Attached SCSI)ドライブ、保管コストを重視したストレージプールには3.5インチのニアラインSASドライブをそれぞれ採用している。

 また、外部ストレージをStorwize V7000直下に接続し、このストレージを新たなストレージプールとして管理することも可能だ。Storwize V7000のストレージ仮想化機能は、同社で定評のあるSANボリューム・コントローラー(SVC)のマイクロコードを流用して設計されているため、発売当初から150種類にも及ぶさまざまなベンダー製品を同時にサポートできた。


データの重要度やアクセス頻度に合わせて複数のストレージプールを使い分けるのが現実的な運用形態となる。ここで必要になるのがストレージ階層管理である

 

モニタリング結果に基づいてデータ再配置を行う自動ILM機能『Easy Tier』

 データの重要度やアクセス頻度は、時々刻々と変わる性質を持っている。このため、ある特定のストレージプールにデータがそのまま保管され続けるのではなく、その時々によってストレージプール間を移動できることが望ましい。そこで、主要なディスクサブシステムには、サーバーからのデータアクセスを遮ることなく、オンラインでストレージプール間のデータ移動を自由に行える機能が搭載されるようになった。このような仕組みは、ILM(Information Lifecycle Management)などと呼ばれることが多い。

 先述のStorwize V7000にもILM機能が搭載されており、サーバーから見える論理ボリュームの姿を変えることなく、実際のデータが保管されているストレージプールを自由に移動できる。一般に、ILMにおけるデータ配置の最適化は、ユーザーがあらかじめ決めたポリシーに従って実行されるが、システムの将来的な振る舞いが明らかに予測できる場合を除けば、多くのケースで管理の負担を増大させる原因となる。これに対し、Storwize V7000は、『Easy Tier』と呼ばれる自動ILM機能によってユーザーの負担を軽減している。

 Easy Tierは、過去24時間の稼働状況を監視し、アクセス頻度の高いデータを高速なストレージプールへ、逆にアクセス頻度の低いデータを低速なストレージプールへと動的に再配置する。再配置が行われるデータの最小サイズ(エクステント)は、16MBから8GBまで柔軟に選択可能だ。エクステントのサイズを小さくすれば小容量のストレージプールを効率的に扱えるが、大容量のデータアクセスは逆に低速になる傾向にある。結局はバランスが重要であり、佐野氏によれば「IBMの開発部門が実際に検証したところ、多くの顧客にマッチするサイズは256MBだった」という。

 エクステントのサイズはオンラインで変更可能であり、またEasy Tierの機能そのものも自由にON/OFFできる。このため、実際に運用しながらエクステントのサイズを調整したり、場合によってはONとOFFを切り替えたりすることで、自社のシステム環境に合ったパフォーマンスチューニングを実施すればよい。Easy Tierは、一般的なILM機能と違って小サイズのエクステントに基づいてデータ再配置が行われるため、キャッシュメモリーライクに利用できる点が大きなメリットだ。SSDを少数搭載しただけでもユーザーの体感速度が確実に向上し、高価なSSDを導入しやすくするという意味で注目に値する。

ILM機能は、サーバーから見える論理ボリュームの姿を変えることなく、サービス無停止でそのデータの保管場所を適切なストレージプールに再配置するためのアプローチであるEasy Tierは、データの最適配置をストレージシステム自身が動的に行う機能である。小さなサイズのデータ単位で再配置が行われるため、高速なストレージプールをキャッシュメモリライクに使えるのが特徴だ。例えば、高速なストレージプールを少数のSSDで構成しただけでもユーザーの体感速度が大きく向上する

 

プール化とシンプロビジョニングを組み合わせるのがベストな運用形態

 昨今のストレージ仮想化時代においては、プール化と並んでシンプロビジョニング(thin provisioning)も重要な技術のひとつである。シンプロビジョニングは、サーバーで扱われる論理ボリュームのサイズを柔軟に決められるようにするテクニックのことだ。従来は、ディスクサブシステムに搭載されている物理容量を上限として論理ボリュームのサイズを割り当てていた。当然、将来を見越して余裕を持たせた物理ディスクを搭載し、論理ボリュームのサイズも大きめに割り当てるのが基本だった。このような割り当て方は、ディスク容量の無駄遣いをやゆしてファットプロビジョニング(fat provisioning)と呼ばれている。

 これに対し、シンプロビジョニングは、ディスクサブシステムの物理容量をはるかに上回るサイズをあらかじめ割り当て、実データ量の推移を見ながら物理ディスクを必要に応じて増設していく形がとられる。つまり、実際に使用している容量+α程度の物理ディスクを搭載しておけばよく、これがシン(thin)と呼ばれるゆえんである。

 ただし、シンプロビジョニングは、プール化と組み合わせてこそ最大の効果を発揮する。プール化をしておけば、シンプロビジョニングによって節約できたディスクスペースをほかのボリュームにも流用できるようになるからだ。サーバーが利用する論理ボリュームのサイズをシンプロビジョニングによって十分大きく見せかけておけば、ユーザーはディスクスペースの残量にとらわれることなく本来のビジネスに専念できるようになる。

 このように運用するとディスクスペースが無駄に消費されるのではないかと危惧(きぐ)する向きもあるが、佐野氏によれば「プール化とシンプロビジョニングを組み合わせた顧客のストレージ環境を実際に調べてみると、ディスクの使用率は平均して30%台、容量管理が行き届いた一部上場企業では20%台のところさえある。もはや杞憂(きゆう)といっていいレベル」と説明する。すなわち、実装すべき物理ディスク容量をさらに減らして設計しても問題ないということだ。


シンプロビジョニングを利用すれば、サーバーが利用する論理ボリュームとしてストレージシステムの物理ディスク容量をはるかに上回るサイズを割り当てられる。にもかかわらず、ストレージシステム上には実際に書き込まれたデータだけが物理的に保管される

 

シンプロビジョニングの本質は容量の節約ではなく運用管理の大幅軽減にある

 シンプロビジョニングは、論理ボリューム側の実使用量が実際に搭載されている物理ディスク容量を超えたときに破たんする危険性をはらんでいるが、このような問題を解消できるのもプール化を併用してこそである。プール化とシンプロビジョニングを組み合わせた環境では、それぞれの論理ボリュームが融通を利かせあうため、実使用量が物理容量を超える危険性が事実上なくなる。

 佐野氏は、むしろシンプロビジョニングの危険性について固執する考えに対し、「技術的な知識が豊富にある人ほど、こういったミクロなことに振り回される。近年のコンピュータシステムは、マス(システム全体)で包括的に管理して、その中で発生するかもしれない例外をどうやって対処していくかが重要だ。システム全体のデザインを軽視して、ひたすら重箱の隅をつつくような姿勢は、エンジニアとして間違っている」と警笛を鳴らす。筆者はエンジニアという立場ではないものの、どちらかといえば重箱の隅をつつくのが仕事なので、佐野氏のこの言葉にはドキっとさせられた。

 なお、シンプロビジョニングは、ディスク容量を節約する道具としてだけ見ていたらまだ不十分である。節約すべきなのは、ディスク容量ではなく、むしろ運用管理の手間である。昨今のコンピュータシステムが多数のサーバー(仮想サーバー)と少数のストレージシステムから構成されていることはすでに述べた通りだが、シンプロビジョニングがなければ、日々の運用において各サーバーのボリュームサイズを変更する作業がしばしば発生する。

 近年では数百、数千といった仮想サーバーが稼働する仮想インフラも見受けられるようになったが、こうしたシステム環境において、OSへのログオン、ボリュームサイズの変更、OSの再起動、最終的な動作検証などを仮想サーバーごとに実施するとなれば、その手間を想像するだけで気が狂いそうだ。

 プール化とシンプロビジョニングを組み合わせておけば、各仮想サーバーに対して巨大な論理ボリュームをあらかじめ割り当てればよく、あとはシステム全体のディスク使用量に合わせて物理ディスクを適宜増設するだけで済む。つまり、ストレージに絡むサーバー側の運用管理が大幅に軽減されることを意味している。


プール化とシンプロビジョニングを組み合わせた環境では、それぞれのサーバーが使用する論理ボリューム間で融通を利かせあっているため、全体でならしてみれば30%程度しかディスクスペースを消費していない。さらに、シンプロビジョニングを活用することで、サーバーから見えるディスクスペースのサイズをほぼ青天井に引き上げられる。これは、ストレージに絡むサーバー側の運用管理を大幅に軽減する効果をもたらす

 

未来への選択肢を広げるために製品ラインアップを拡充するIBMの戦略

 この何十年かを振り返ってみると、世の中のデータは常に増加の一途をたどっている。デジタル社会といわれる現在では、その増加率がさらに加速しつつある。このような中で、コンピュータシステムにかけられる企業の予算が、データの増加率と比例して増えているわけでもない。だからこそ、プール化とシンプロビジョニングを組み合わせて、限られた予算の中でシステム全体を効率よく回せるようにする努力が必要なのだ。

 佐野氏は、昨今の事情を踏まえたIBMの姿勢について「データも増えているが、ユーザーのニーズも多様化している。だからこそIBMは、大小さまざまなディスクサブシステムとNAS装置、さらにはストレージ仮想化やデータ重複削減のためのアプライアンス、データ保管ソリューション、テープ装置など、製品のラインアップを広げていく戦略をとっている。ユニファイドを標ぼうして製品を少数に集約するベンダーもある中で、IBMは逆に未来への選択肢を増やすという意味合いから、製品ラインアップを拡充する方向に向かっている。昨年10月に発表したIBM Storwize V7000もそのような製品のひとつだ。当社は、顧客が求めている製品をタイムリーに提供し、顧客のビジネスに貢献することが最大の責務である。長期的に見れば、これらの製品の中で淘汰(とうた)が起こるものもあるかもしれないが、顧客のニーズに合致して伸びる製品も少なからずあると期待している」と締めくくった。


IBMは、製品ラインアップを多様化することで顧客のさまざまニーズに応えていく戦略をとっている。基本的なストレージ製品となるディスクサブシステムやNASに加え、ストレージ仮想化やデータ重複削減のためのアプライアンス、テープ装置(オートローダやテープライブラリ)など、あたかもストレージの総合百貨店のような品ぞろえである
関連情報