8ソケットサーバー「HP ProLiant DL980 G7」の実機を試す
何度か、HP ProLiant DL980 G7(以下、DL980)を紹介してきたが、今回HPのご厚意でDL980をお借りして、試してみた。DL980は、動作電圧も200Vで、フォームファクターも8Uのラックマウント、重量も93Kgほどの超ド級のサーバーだ。さすがに、これだけのモノを個人宅に置くわけにも行かない。そこで、DL980をリモート接続で試してみた。
■試用の構成
HP ProLiant DL980 G7 |
DL980では、HPが独自に開発したノードコントローラにより、2組のXeon 7500番台を1つのノードとし、全部で4組のノードを組み合わせている。これにより、8ソケットのXeon 7500番台を1台のサーバーとして動かしている。
実際、WindowsタスクマネージャのCPUを確認してみると、128個のCPUが確認できる。Xeon7500は、1つのCPUに物理コアが8つ入っている。物理コアとしては、8ソケット×8物理コアで64コアだが、Hyper Threadingにより1つの物理コアを仮想的に2つのCPUコアとして利用できるため、128CPUとして利用できる。
いろいろなサーバーをテストしてみたが、タスクマネージャで128個のCPUが確認できるサーバーは初めてだ。タスクマネージャに128個ものCPUが並ぶのは壮観だ。
今回テストしたDL980には、8コアのXeon 7560(2.26GHz)が8ソケット分搭載されている。個人的にも、Windowsのタスクマネージャで128個のCPUメーターが表示されているのは初めて見た | DL980のデバイスマネージャのプロセッサを見ると、すべてのプロセッサを表示するのに画面に収まらなかった |
DL980のOS環境としては、Windows Server 2008 R2 Datacenter Editionを使用した。
Windows Serverのうち、Windows Server 2008 R2 Enterprise Editionは8ソケットまでサポートしているため、DL980でも動かすことはできる。だが、拡張性を考えると、このクラスのサーバーは、Datacenter Editionを利用することになるのだろう。Datacenter Editionなら、最大64ソケット(256論理CPU)にまで対応している。
Datacenter Editionでも、1つのCPUがサポートするコア数が増えてくれば、すぐに256論理CPUに達してしまう可能性もある。DL980でも、次世代のWestmere-EX CPUになれば、1つのCPUで10コアになる。
このため、8ソケットで80物理コア、Hyper Threadingを使えば160論理CPUになってしまう。つまり、Datacenter Editionの最大値に遠からず達してしまうだろう。数年前の状況から考えれば、100論理CPUを超えるサーバーが、8Uほどの大きさと1000万円台(定価ベース)のコストで手に入るというのは信じられない。
■DL980のベンチマークは?
今回は、SPECなどの本格的なベンチマークを行うには、お借りした時間も少なかったので、簡単に動かせるベンチマークを試してみた。
CINEBENCHのベンチマーク結果 |
まずテストしたのは、あまりサーバーでは試さないCINEBENCHというベンチマークを利用した。CINEBENCHでは、フォトリアリスティックな3Dグラフィックを、マルチスレッドを使ってレンダリングする。CINEBENCHがレンダリングするシーンには、約2000のオブジェクトを含み、中には30万ポリゴン以上のオブジェクトがある。さらに、鏡面反射や拡散鏡面反射、エリアライトとエリアシャドウ、プロシージャルシェーダー、アンチエイリアスなどが非常にCPU負荷のかかる処理が含まれている。
このベンチマークでは、CPUコア数が多い方が高いパフォーマンスを示すが、それぞれのCPUコアの性能も重要になっている。このため、多数のCPUコアを持つシステムのベンチマークとしては、ぴったりだ。ちなみに、CINEBENCH R11.5では、最大64スレッドを使ってベンチマークを行うことができる。
テストしてみると、Core i7-860(4コア/8スレッド 2.80GHz)の5倍ものパフォーマンスをクリアしている。CPUに負荷をかけるCINEBENCHを30秒ほどで終了してしまう。今まで、いろいろなサーバーやデスクトップをテストしたが、さすがにこれだけのスピードで処理できたサーバーは今までテストしたことがなかった。これでも、DL980のコア/スレッドは、半分しか使用していない(CINEBENCHの情報では16コア/32スレッドと表示されているが、実際には64スレッドを使用している。どうやらCINEBENCH側のバグのようだ)。
CINEBENCHR 11.5では、CPUだけのベンチマークを試してみた。ベンチマークとしては26.52。画面などをキャプチャしたので、この画面ではパフォーマンスが低下している | CINEBENCHR 11.5では、64スレッドを利用している。DL980にとっては、半分のスレッドしか利用していない |
もう1つは、PassMarkのPerformance Testというベンチマークを実行してみた。Performance Testは、CPUやメモリ、グラフィックなど、さまざまな項目のベンチマークを行うが、今回はCPUに関するベンチマークだけに注目した。
なんとCPUに関するトータルの値は30820と、多くのCPUとは別次元のパフォーマンスを示している。Performance Testのベンチマークは、PassMarkのWebサイトで公開されているため、今回はWebサイトに掲載されているCPUのベンチマークと比較してみた。
発売されているCore i7で最もパフォーマンスの高いCore i7-980Xは、CPUベンチマークとしては10432という値をマークしている。DL980は、約2.5倍のパフォーマンスになっている。このベンチマークでも、DL980で利用されているのは64スレッド、まだ半分余っている。コストを考えれば、DL980でこのくらいしか性能がアップしないと思われるかもしれないだろう。しかし、DL980のCPUクロックは2.26GHz、Core i7-980Xの3.33GHzから見れば1.07GHzもの差がある。DL980の性能の高さは、64CPUコア/128スレッドという膨大なCPUが集まっているマルチコアシステムのおかげだろう。
PassMarkのPerformance TestでCPUベンチマークを行った。このベンチマークでも64スレッドしか利用されていない | PassMarkのWebサイトでは、Performance TestのCPUベンチマークが掲載されている。もちろん、トップの性能を示している |
IntelのLinpackベンチマークのWebサイト。ちなみに、このベンチマークをAMD Opteron環境で動作させてみたら、CPUチェックで動作しなかった |
チューニングができていないので、大ざっぱなデータしか出ていないが、平均値と最大値がほぼ一緒の値となっている |
スーパーコンピュータのベンチマークTop500のデータ。ここでは、GFLOPSではなく、TFLOPSが単位となっている |
最後に試してみたのは、HPC用のベンチマークとして利用されるLinpackというベンチマークだ。今回は、Intelが自社のMathカーネル ライブラリを利用したLinpackベンチマークを利用した。OSも、Linpackのベンチマークでは、Linuxなどが利用されることが多いが、Windows Server 2008 R2 Datacenter Editionをそのまま使った。
また、LinpackはHPCの世界Top500を決めるベンチマークの1つとして使われている。このため、Top500で利用されるLinpackは、チューニングをぎりぎりまで行って高い性能を出すようにしている。今回は、そこまでチューニングを行うことはできないため、IntelのLinpackベンチマークをデフォルトのままで使用した。
IntelのLinpackベンチマークでは、物理コア数でベンチマークを行うため、DL980では64スレッドとなり、Hyper Threadingを利用した128スレッドにはならなかった。設定により、128スレッドでのベンチマークも行えるようだが、今回はDL980をお借りできる時間に制限があったため、最後までテストしきれなかった。
また、ほかのサーバーでIntelのLinpackベンチマークを試した見たわけではないので、比較対象となるベンチマークがないが、最高値で約120GFLOPに到達している。世界でトップのスーパーコンピュータ(2010年6月現在)は、米国のオークリッジ国立研究所のスーパーコンピュータで、約2331TFLOPSとなっている。これは、今回試したDL980のベンチマークの約2万倍の性能だ。
オークリッジ国立研究所のスーパーコンピュータは、CPUコアの数もすさまじく、22万4162個ととてつもない数だ。スーパーコンピュータ自体の価格は、サーバーとは比べものにならない金額となっている。
ちなみに、現在開発が進められている理化学研究所の次世代スーパーコンピュータ「京」は、総事業予算1120億円となっている。さらに、年間の運用費は80億円。なんと、電力代が22億~29億円と、一般の企業においては考えられないシステムだ。
こういったスーパーコンピュータの価格や運用費から考えれば、DL980が1000万円台で、これだけの性能をクリアしているというのはコストパフォーマンスが非常に優れているといえる。また、通常のデータセンターのラックに配置できるため、特殊な冷却システムなどは必要ない。こういったことからも、ハードウェアコスト以外にかかる、運用コストが大幅に安くなる。
■iLO3でシステム環境を管理
iLO3のログイン画面。今回は、DL980からアクセスしたが、iLO3はDL980が停止していても、リモートからアクセスして、システムを起動することができる |
DL980には、管理システムとしてiLO3が搭載されている。DL980では「センサーの海」と称されるほど、システム上に膨大な数の温度センサーが用意されている。この温度センサーの情報を活かして、ファンを効率的に動かし、DL980自体を効率よく冷却しようというものだ。
温度センサーが少ないと、システム内部の各所の温度をキチンと把握できないため、ファンを余計に回してしまう。しかし、DL980のように各所に温度センサーが用意されていれば、必要な部分に必要なだけファンを回して冷却を行う。必要がなくなれば、ファンを止めることが出来る。
こういった温度センサーの情報は、iLO3を使って簡単に確認することができる。iLO3の画面では、温度とステータスなどが表示されている。もし、設定温度以上になると、アラートが表示されるため、管理者はキチンとシステムの状況を把握することができる。
できれば、単なるリストではなく、サーバーの内部イラストと重ね合わせて、どの部分の温度が、どのくらいアップしているのか見える化されていると便利かもしれない。
iLO3を使ってみて、これば便利と思ったのが、システムの消費電力を時系列でグラフ化してくれる機能だ。これを見れば、ピークの消費電力やアベレージの消費電力などを簡単にチェックすることが可能だ。
PDUに内蔵されたワットチェッカー機能などで、消費電力をチェックは出来たが、内蔵されたシステムで、時系列の情報がとれるのは便利だ。システムの負荷情報などと組み合わせれば、「いつどのくらいの電力を消費しているのか?」などを簡単に把握することができる。
iLO3でDL980の温度センサーを表示した。Linpackのベンチマークを動かしてみたが、冷却がしっかりしているため、アラートが表示されることはなかった | iLO3でシステムの消費電力をグラフで確認することができる |
■DL980の用途は?
これだけの性能を持つDL980だが、どういった用途で使われるのだろうか?
まず考えられるのは、HPCの分野だろう。Linpackのベンチマークで分かるように、DL980はコストパフォーマンスに非常に優れた性能を持っている。
企業においては、プライベートクラウドを構築するハードウェア基盤となるだろう。これだけのCPUコア/スレッドを持つDL980なら、4仮想CPUを持つサーバー環境なら32台分の仮想サーバーが同時に動作できる。もちろん、メモリに関しても最大2TBものメインメモリを搭載できる。これだけのメモリがあれば、多数の仮想サーバーを動かすにも、十分なメモリが割り当てられる。
HPではDL980の企業におけるメリットとして上げているのは、集約化によりソフトウェアのライセンスコストの削減だ。ソフトウェアのライセンスは、毎年コストがかかるため、複数台のサーバーでデータベースなどを動かすよりも、1台のハイパフォーマンスなサーバーに集約した方が、年間コストも安くなる。
さまざまな状況が考えられるが、数年分のソフトウェアライセンスを整理するだけで、DL980のハードウェアが購入できてしまうという試算もあるぐらいだ。ライセンスコストは、データベース、仮想化ソフトウェアなど、さまざまなソフトウェアに関連しているため、1台のサーバーに整理統合するだけで、企業にとってはコストメリットが出しやすい。
このような用途を考えていくと、DL980は企業にとっては高価なサーバーだが、コストメリットが分かりやすい導入しやすいサーバーといえるのかもしれない。