前世代に比べて大きな性能アップを果たしたXeon E5 2600の性能をチェック
IntelはこれまでSandy Bridge-EPの開発コードネームで開発してきたXeon E5 2600シリーズを3月6日(米国時間)に発表した。別記事で解説したとおり、Xeon E5 2600シリーズは、従来のXeon 5600シリーズに比較してダイサイズは倍近くになりながら、消費電力は従来モデルと同じかそれを下回るレベルに押さえつつ、性能を大幅に向上した製品となっている。
本記事では、いち早く入手したXeon E5 2600のサンプルを利用して、前世代となるXeon 5600シリーズからどの程度性能が向上しているのかを、ベンチマークプログラムを利用して確認していきたい。Xeon E5 2600シリーズは解説記事でも述べたとおり、コア数増加、AVXという新しい命令セットに対応といったプロセッサーコアの拡張だけでなく、アンコア(プロセッサーコア以外の部分)の拡張にも力を入れており、そのあたりも含めてチェックしてきたい。
■新しいCPUソケットLGA2011を採用しているXeon E5 2600
Xeon E5 2600シリーズ(以下Xeon E5 2600)は、一昨年に発売されたXeon 5600シリーズ(以下Xeon 5600)の後継となる、サーバー/ワークステーション向けプロセッサーで、これまでSandy Bridge-EPの開発コードネームで開発されてきた製品だ。
Xeon E5 2600の特徴に関してはすでに別記事で解説したとおりなので、ここでは繰り返さないが、ハードウェア面での違いに関してはここでは紹介していきたい。Xeon E5 2600シリーズは、Socket Rの開発コードネームで知られる新しいCPUソケット“LGA2011”を利用している。このLGA2011は、その名の通り2011ピンのピン数を持つCPUソケットで、従来のSocket BことLGA1366を置き換えるIntelの新しいソケットとなる。なお、Socket Rの“R”はXeon E5 2600のチップセット(Intel C600)を含めたプラットフォームの開発コードネームRomely(ロメリー)のRに由来する。
LGA2011になり、ピン数が増えた最大の理由は、メモリのチャネル数が増えたことだ。従来製品のXeon 5600ではメモリはプロセッサーあたり3チャネルという構成になっていたのだが、Xeon E5 2600シリーズではプロセッサーあたり4チャネルという構成になっており、帯域幅の向上というメリットと、1つのプロセッサーにぶら下げられるメモリモジュールの数が増えているのが特徴となっている。
製品ブランド | Xeon 5600 | Xeon E5 2600 | |
CPUソケット | LGA1366 | LGA2011 | |
メモリ | メモリチャネル | 3 | 4 |
DDR3-1600(チャネルあたりのDIMM数/RDIMM利用時) | ― | 対応(2) | |
DDR3-1333(チャネルあたりのDIMM数/RDIMM利用時) | 対応(2) | 対応(2) | |
DDR3-1066(チャネルあたりのDIMM数/RDIMM利用時) | 対応(2) | 対応(3) | |
DDR3-800(チャネルあたりのDIMM数/RDIMM利用時) | 対応(3) | 対応(3) |
メモリ面での性能向上という意味ではチャネルが増えたこともそうだが、もう1つの大きな要素としてクロック周波数の向上があげられる。
Xeon 5600では、公式にサポートされるDDR3のクロック周波数は1333MHz(実際には666MHz×2)までとなっていたが、Xeon E5 2600では1600MHz(同800MHz×2)まで対応しており、メモリの帯域幅を最大でプロセッサーあたり51GB/秒へと引き上げることが可能になっている(Xeon 5600では32GB/秒)。これにより、大量にメモリ帯域を消費するようなアプリケーションでは大きな性能向上が期待できることになる。
ただし、各チャネルに利用できるメモリモジュールの数は、DDR3のクロック周波数により制限される。DDR3-1333/1600利用時にはチャネルあたり2モジュール、DDR3-1066/800利用時にはチャネルあたり3モジュールとなる。
Xeon E5 2690 | Socket RことLGA2011 |
■S2600GZのマザーボードを採用しているラックサーバー「Intel ServerSystem R2000」
CPUソケットが新しくなったことからもわかるように、Xeon E5 2600を利用するには新しいマザーボードが必要になる。従来のXeon 5600とはマザーボードには互換性がないため、新しいシステムへリプレースしたい場合には、プラットフォームごとの交換となる。
Intelは小規模なホワイトボックスのサーバーベンダーやチャネル事業者などに向けたサーバー製品として、マザーボード、シャシー、RAIDコントローラなどを提供しており、それらを組み合わせて顧客に対して製品を提供できるようにしている。このXeon E5 2600でも同様で、Server Boardと呼ばれるサーバー用マザーボード、そのマザーボードを搭載しているラックマウント用のシャシーなどがラインナップされており、従来同様チャネルやホワイトボックスベンダーなどに提供される。
Xeon E5 2600シリーズ用のマザーボードは、S2600シリーズとなる。複数の製品が用意されており、具体的には以下の製品が用意されている。
製品名 ナンバー | 開発コードネーム | CPU ソケット | メモリソケット /プロセッサー |
S2600JF | Jefferson Pass | 2 | 4 |
S2600WP | Washington Pass | 2 | 8 |
S2600CO | Copper Pass | 2 | 8 |
S2600CP | Canoe Pass | 2 | 8 |
S2600CR | Crown Pass | 2 | 8 |
S2600IP | Iron Pass | 2 | 8 |
S2600GZ | Grizzly Pass | 2 | 12 |
なお、余談になるがIntelのマザーボードの製品名は、S(Serverを意味する、Desktop Boradの場合はD)+CPUのシリーズ名(ないしはチップセット名)+アルファベット2文字というという構成になっている。最後のアルファベット2文字は開発コードネームの縮小系となっており、S2600GZであれば、コードネームのGrizzly Passの2文字からとってGZの型番がつけられている。
今回Xeon E5 2600のテストに利用したのはS2600GZと、それを搭載したラックマウントシステム「Intel ServerSystem R2000」だ。S2600GZはIntelのXeon E5 2600用マザーボードの中ではもっともハイエンドに位置する製品で、メモリソケットはプロセッサーあたり12個、つまりボード全体で24個が用意されている(他の製品はプロセッサーあたり8個のものが多い)。大容量のメインメモリを搭載し、仮想マシンなどを多数走らせたいような用途向けのマザーボードと言えるだろう。
チップセットにはIntel C600が採用されており、ボード上には2つの6GbpsのSATAポートの他、最大で8台までのSAS/SATAポートを利用することが可能になっている。拡張スロットはボード上にPCI Express Gen3 x24が用意されており、そこにライザーカードを挿入して利用する形だ。イーネットはギガビットイーサネットが4つ、さらにはオプションでハードウェアRAIDカードが用意されており、それを利用することができる。
用意されているハードウェアRAIDはRMS25CB080という製品で、LSI 2208のデュアルコアRAIDコントローラが搭載されており、帯域幅は3GB/秒、ピーク性能は465K IOP/秒となる。2つの8087コネクタが用意されており、最大で8つのドライブを接続して利用することが可能だ。
S2600GZを搭載したラックマウントのシャシーがIntel ServerSystem R2000だ。前面ベイの構成はユーザーのニーズに合わせて調整可能で、最大で24個の2.5インチドライブベイを内蔵させたり、12個の3.5インチベイを用意したりすることができる。電源構成もユーザーのニーズに合わせて変更が可能で、80+Platinumに対応した750Wないしは80+に対応した460W電源などからチョイスすることができる。
Intel ServerSystem R2000は、マザーボードにS2600GZを採用したラックマウントサーバー |
IntelのXeon E5 2600向けマザーボードS2600GZ | S2600GZのオプションとして用意されるRMS25CB080 |
■AVX対応により大きな性能向上を実現、アンコア部分の大きな性能向上も
それでは、サンプルとして入手したIntel ServerSystem R2000を利用してXeon E5 2600の性能をチェックしていこう。今回のシステムにはXeon E5 2600のサーバー向けとしては最上位SKUとなるXeon E5 2690を利用した。Xeon E5 2690はベースのクロック周波数が2.9GHz、8コア/16スレッド構成で、LLCは20MBというスペックになっている。
比較対象として用意したのは、前世代となるXeon 5600の発表当時の最高峰SKUであるXeon X5690で、ベースクロックは3.4GHz、6コア/12スレッド、LLCは12MBという構成になる。さらに2世代前のNehalem-EPことXeon 5500シリーズのXeon X5570も用意した。ベースクロックは2.93GHzで、4コア/8スレッド、LLCは8MBという構成になっている。いずれも2ソケット構成の環境で利用している。なお、テスト環境は表3の通りで、結果はグラフ1~グラフ5の通りだ。
CPU | Xeon E5 2690 | Xeon X5690 | Xeon X5570 |
チップセット | Intel C600 | Intel 5520 | |
マザーボード | S2600GZ | S5520UR | |
メモリ | DDR3-1600(11-11-11-28) | DDR3-1333(10-9-9-24) | |
メモリ容量 | 128GB | 6GB | |
HDD | intel SSD710/200GB | ||
OS | Windows Server 2008 R2 Enterprise |
【グラフ1】CineBench R11.5 CPUTest |
CineBench R11.5は、MAXON社が提供するベンチマークソフトウェアで、映像をレンダリングするのにかかる時間を計測して処理速度を計測するタイプのベンチマークソフトウェアだ。最大で64スレッドまで並列に処理することができる。レンダリングはOpenGLを利用した場合と、CPUを利用した場合の両方がサポートされているが、今回はもちろんCPUを利用した。
このCineBenchは新しい命令セットであるAVXには未対応で、純粋にコアの性能強化を確認することができるのだが、前世代のハイエンドに比べて1.4倍の性能、2世代前の同クロックに比べると2.5倍の性能があることが確認できた。
【グラフ2】Sandra 2012 Business SP2 CPU |
Sandra 2012 Business SP2はSiSSoft社のベンチマークプログラムで、CPU、メモリ、ストレージなどコンポーネント単位でベンチマークを取ることができる。Sandra 2012 Business SP2のCPUテストでは、整数演算のDhrystoneと浮動小数点演算のWhetstoneの2種類のテストが用意されている。Dhrystoneでは前世代に比べて2.23倍、Whetstoneでも前世代に比べて2.21倍と性能が向上していることがわかる。
【グラフ3】Sandra 2012 Business SP2 Multimedia |
Sandra 2012 Business SP2のMultimediaテストでは主に、AVXを利用した場合の性能をチェックしていきたい。このテストではSSEやAVXなどを利用して整数や浮動小数点演算を行った場合の性能を計測している。グラフにはAVX命令をオフにした場合のXeon E5 2690の結果も掲載している。まずAVXを使わない場合だが、前世代に比べて1.82~1.98倍となっている。
特筆すべきは浮動小数点演算でAVXを有効にした場合だろう。AVXをオフにした場合に比べて倍の性能を実現している。つまり、AVXを有効にした場合には、AVX以外での約2倍の性能向上にあわせて、AVXに対応したことでさらに倍の性能向上を実現しているので、実に4倍近い性能向上を見せている。もちろん、AVXを利用するにはアプリケーションの側がAVXに対応している必要があり、そうでない限りは意味が無いのだが、今後AVXに対応したアプリケーションが登場することで、このような大きな性能向上が期待できるということができるだろう。
【グラフ4】Sandra 2012 Business SP2 コア間帯域(GB/秒) |
Sandra 2012 Business SP2のコア間帯域テストでは2つのCPUコア間でデータをやりとりする場合の帯域幅を計測する。別記事で解説した通り、前世代の製品ではプロセッサーあたり2つ用意されているQPIと呼ばれるインターコネクトを、CPUーCPUだけでなく、CPU-チップセットにも利用していたのだが、Xeon E5 2600では2つともCPUの接続のみに利用している。このこともあり、帯域幅が大幅に上がっていると容易に想像できるのだが、ベンチマークの結果もそれを裏付けている。
【グラフ5】Sandra 2012 Business SP2 整数 メモリー帯域(GB/秒) |
Sandra 2012 Business SP2の整数メモリー帯域は、整数演算時のメモリ帯域を計測するテストだ。いずれの結果も理論値を超えているが、これは2つあるプロセッサーに接続されているそれぞれのメモリに対して擬似的に複数のスレッドでアクセスしているためだ。結論から言えば、前世代がいずれも30GB/秒程度のメモリ帯域しかでていないのに対して、Xeon E5 2690は70GB/秒と倍以上の帯域幅がでている。このあたりはメモリコントローラの効率を含めてXeon E5 2690が改善されていることを見て取れると言っていいだろう。
■前世代から倍近い性能向上、2世代前からは3倍程度の性能向上を実現しているXeon E5 2600
以上のような結果から、新しいXeon E5 2600は、前世代のXeon 5600と比較して大幅な性能向上を実現していることがわかると思う。さらに、アプリケーションがAVXに対応した場合には、より大きな性能向上を手に入れられることがわかる。これから、新しいソフトウェアを設計する場合には、ぜひともAVX対応をチェックシートに入れたいところだ。
また、CPUのコア部分の性能向上だけでなく、アンコア部分の性能向上もXeon E5 2600の特徴と述べてきたが、コア間の帯域やメモリ帯域幅などの大きな向上からもそれがわかると思う。今回はコンポーネント単位のベンチマークプログラムのみを実行したが、これらのコンポーネントごとの性能向上はサーバー全体の性能向上につながっていることは間違いないだろう。
特にほぼ同じくクロック周波数で3年前の2009年に投入されたXeon X5570との比較では、AVXを有効にしなくても3倍近い性能向上を実現しており、これらのシステムを稼働させている環境であれば、Xeon E5 2600ベースのシステムへと入れ替えることで大きな性能のゲインを得ることが可能だろう。