仮想化道場

データセンターでの電力・温度管理を支援する「Intel Data Center Manager」

 Intelは、CPUやチップセットなどの半導体だけでなく、さまざまなソフトウェアも提供している。エンタープライズ分野では、そのなかでもデータセンターやクラウド事業者など、膨大な数のサーバーを運用するユーザーにとって電力や温度を管理するData Center Manager(DCM)というソフトウェアを提供している。

 今回は、米国本社でDCMを担当しているIntel Data Center SolutionsのJeff Klausディレクターにお話を伺った。

効率よくサーバー群の電力を管理するためのソフトが「DCM」

――まず、DCMの概要に関して説明をお願いします。

Intel Data Center SolutionsのJeff Klausディレクター

 DCMは、3年前から始まりました。DCMの開発を始めた理由としては、2009年以降、タブレットやスマホなどが急速に拡大し、PCだけでなく、さまざまなデバイスから企業のサーバーにアクセスするようになりました。これに伴い、急速に企業が利用するサーバーの数が増えてきています。

 データセンターやクラウド事業者においては、単純にサーバーの数を増やせるような状況ではなくなっています。

 1台のサーバーが消費する電力は小さくなり、パフォーマンスも格段にアップしていますが、こういったハードウェアの進化をしのぐほど、急速にデータセンターやクラウドが必要とするサーバーの台数が増えています。

 これにより、ハードウェアコストだけでなく、消費電力や発熱などのランニングコストが大きく増えています。データセンターによっては、システムを増強したくても、スペースはあるのに、電気事業者から電力供給ができないなどの問題でシステム増強ができない、といったことが問題になってきました。

 そこで、効率よくサーバー群の電力を管理するためのソフトウェアが必要とされるようになりました。これに応えるためにDCMを開発したのです。

データセンターやクラウドは、ユーザーの増加、デバイスの増加、データの増加により、規模の拡大が要求されている
データセンターにおける重要事項は、消費電力量だ。電力コストもあるが、データセンターが大規模になれば、それに見合う電力が安定的に供給されるかということも問題になっている
DCMによって、サーバー単位にリアルタイムで電力や温度のデータが取得可能。さらに、データベースにより24時間365日のデータが保存されているため、どの時期にどのくらい電力を消費するのか予測することもできる

Intelが手掛ける理由は?

――電力消費を管理するソフトウェアは、サードパーティからもリリースされていると思いますが、Intelが手がける意味はどこにあったのでしょうか?

 データセンターやクラウドなどで今まで使われてきた電力監視ソフトウェアは、ラックレベルやPDUレベルの電力を測定し、管理していました。個々のサーバーレベルでの消費電力の監視まではできていなかったのです。また、電力を適切なタイミングで管理する上でも課題がありました。

 これは、電力監視ソフトウェアを提供しているソフトウェアベンダーが、サーバーの内部からデータを取得することまではしていなかったためです。

 サーバー内部からデータを取得するためには、ハードウェアベンダー各社がサポートしているプロプライエタリな電力測定プロトコル、管理プロトコルをサポートする必要がありました。

 また、データセンターやクラウドに導入されているサーバーも1社に限定されているわけではないため、サーバーベンダーが提供するひとつの電力管理ソリューションでデータセンター内のすべてのデバイスを管理するのには、無理がありました。

 そこで、プロセッサやチップセットなどサーバーにとって重要なパーツを提供し、さまざまなサーバーが持つ各種のプロトコルを最もよくわかっているIntelこそが、DCMというソフトウェアを開発することにしたのです。

 もちろん、DCMはIntelアーキテクチャのサーバーだけでなく、ほかのアーキテクチャのサーバーもサポートしていますので、さまざまなサーバーが導入されている企業で利用可能になっています。

DCMのソフトウェアアーキテクチャ。サーバー各社が独自に持つ管理機能をサポートしているため、各社のサーバーを一元的に管理することができる

使われなくなるのを防ぐためにSDKとしてリリース

 ただ、DCMはパッケージソフトウェアではありません。データセンターの電力と温度を管理するためのWebサービスAPIを持つSDKです。例えば、Dellのデータセンター向けの制御・電力管理ソリューションの「OpenManage PowerCenter」に使われたり、Schneider Electricが提供している「TruxureWare」で使われてたりしています。

 これ以外にも、大規模なデータセンターを運用している企業やクラウド事業者などが利用している、独自の管理ツールなどに利用されています。

 DCMをWebサービスのAPI SDKとして提供したのは、各社がすでにさまざまな管理ソフトウェアを提供したり、独自開発の管理ツールを持っていたりするためです。ここに、全く新しいユーザーインターフェイスを持った電源管理ソフトウェアを提供しても、利用しにくいだけでなく、結局使われないと思ったのです。

 やはり、現状利用している管理ツールと一体として利用できるようにしないと、電源管理ツールだけでは使いにくいと思います。

 また、個々のサーバーの消費電力や発熱などが計測できても、そのデータを使って、負荷の軽いサーバーから仮想マシンをライブマイグレーションし、別のサーバーに負荷を統合して、負荷がなくなったサーバーを休止させる、といった一連の作業を自動化するためには、1つのソフトウェアだけで実現できません。

 さまざまな管理ツールと組み合わせることで、このような高度な作業を自動化できるのです。だからこそ、最初から各社の管理ツールに組み込んでもらうように開発しました。このため、エンドユーザーの方々は、DCMというソフトウェアをほとんど意識して使っていないことも多いと思います。

DCMはWebサービスAPIのSDKとして提供されているため、ソフトウェアベンダーの管理ソフトに導入されたり、サーバーベンダーの管理ソフトに内蔵されたりしている。また、大規模なデータセンターやクラウドを運用している企業では、独自の管理ツールに組み込んでいる
DCMを使うことで、高価なインテリジェントPDUを利用せずに、電源の状態が監視できる。これ以外に、リアルなデータを使ってキャパシティプランニングを行うことも可能だ
DCMを採用した企業。Dell、Lenovo、Supermicro、SGIなどのハードウェアベンダーだけでなく、Schneider Electricなどの管理ソフトウェアベンダーも採用している

DCMの導入事例は?

――例えば、DCMはどういったデータセンターやクラウドで利用されているのでしょうか?

 韓国でトップの通信企業のKorea Telecom(KT)のクラウドの管理に利用されています。KTでは、DCMを採用したことで、クラウド全体で15%の電力消費を抑えられるようになりました。年間ラックあたり2000ドルのコストを削減できました。

 これ以外にも、Open Stackを採用しているクラウド事業者のRackspaceでは、25%のコスト削減が行えています。また、Yahoo!もDCMを採用しています。

 日本国内でも、いくつかのクラウド事業者やソフトベンダーとお話ししています。近いうちに、日本国内での事例もお話しできるようになると思います。現在お話しできる日本国内の事例としては、富士通がコンテナ型データセンターの管理に、DCMを採用することを決めています。

Korea TelecomやTencentなどでは、DCMを使うことで、データセンターの消費電力を効率よく管理できるようになっている
rackspaceなどのクラウド事業者、Yahoo!などの大規模なデータセンターを運用している企業にDCMは大きなメリットをもたらしている

――DCMを利用することでデータセンターやクラウド事業者にはどういったメリットがあったのでしょうか?

 先ほどの事例のように、データセンターやクラウドのサーバーにおける消費電力を抑えることが可能になります。ラック内のサーバーごとに消費電力や温度をリアルタイムで把握し、サーバーごとにポリシーベースのパワーキャッピングを行うことで実現しています。

 これにより、よく冷却が効くサーバーはパフォーマンスを上げて動作させ、ラックの中央にあって、あまり冷却の効いていないサーバーはパフォーマンスに制限を加え、あまり発熱しないようにするなど、サーバーごとにリアルタイムでデータが取得できているがゆえの、今までとは違った細かなレベルでの管理が可能になります。

 1ラックあたりに何台のサーバーを積載するかなどを決めるときも、今までなら仕様上の上限とIT部門のノウハウで、低めに上限を設定していました。

 このラックをDCMを使って実際に運用してみると、実稼働ではIT部門が見積もったよりも低い消費電力でした。そこで、ラックに積載させるサーバーの上限を増やしても問題ないことがわかったのです。

 こういったことは、リアルタイムに細かなデータが取得できるDCMならではでしょう。ある事例では、今までの1.6倍のサーバーがラックに積載できるようになり、効率がアップしました。

 DCMでは、単にリアルタイムのデータがわかるだけでなく、内部にデータベースを持っているので、稼働時の消費電力や温度などのデータがすべて記録されています。このデータとサーバーの稼働データなどを組み合わせれば、どういった状況で負荷が高くなるのかなどが一目でわかります。

DCMは、リアルタイムに消費電力や温度のデータを記録している。このため、ラックのキャパシティプランニングを実データをベースにして最適に行える
DCMを使えば、高価なインテリジェントPDUを使わずに消費電力のモニタリングが行える
障害発生時にも、DCMを使えば電力のマージンをリアルタイムに把握して、各サーバーのパワーキャッピングを変更して対処することができる
ワークロードに応じた機器の管理が行える
サーバー内部の温度センサーの情報を取得できるため、サーバーやラックの温度分布を把握することが可能

 DCM自体は、非常に面白いソフトウェアだ。さまざまなサーバーベンダーと密接な関係を築いているIntelならではのノウハウが組み込まれているのだろう。しかし、残念なのは、インテルはDCMを、単に管理ソフトウェアを構築するためのパーツとして考えていることだろう。

 できれば、Intelがコンソーシアムなどを作り、データセンターやクラウドで利用する各種のAPIを規定していけば、単に電力と温度などを監視するだけでなく、ユーザーが作成したさまざまなポリシーに従った自動運用ができるシステムが構築できるのではないかと、筆者は考えている。

 また、さまざまなデータセンターやクラウドが持つベストケースをデータとして、コンソーシアム経由で自動的に提供することで、より自社のデータセンターやクラウドの運用を高度なレベルに持っていくことができるだろう。こういったことができるようになれば、DCMもより多くのベンダーで採用されるようになるのではないか。

(山本 雅史)