仮想化道場

Haswell世代のXeon E5、1600/2600 v3シリーズ登場

 デスクトップのHaswellプロセッサがリリースされてから15カ月ほどで、2ソケットサーバー向けのHaswellプロセッサが発表された。今回のHaswellプロセッサでは、コアアーキテクチャに関してはIvy Bridge世代から小幅な変更だが、それ以外のところで、いろいろと注目すべき機能がそろっている印象だ。

 今回は、そのHaswell世代のXeon E5(型番はXeon E5-1600/Xeon E5-2600 v3シリーズ)について解説する。

今回は、Haswell世代のXeonとして、主に2ソケット向けのXeon E5-2600 v3シリーズ、1ソケット向けのXeon E5-1600 v3シリーズがリリースされた(ここには、Xeon E5 1600 v3は掲載されていないが同時にリリースされた)
Xeon E5 2600 v3シリーズの特徴
Xeon E5 2600 v3のラインアップ

Xeon E5-1600/2600 v3シリーズのハード面

 Haswell世代のXeon E5であるXeon E5-1600/2600 v3シリーズは、CPUのコアアーキテクチャとしては小幅な変更となっているが、もっとも大きな変更は、サポートされるメモリがDDR4になったことだろう。

 Ivy Bridge世代のXeon E5シリーズではDDR3 1866MHzが最大だったのに対し、Haswell世代のXeon E5シリーズでは、DDR4 2133MHz(最大)がサポートされた。メインメモリの性能アップは、コンピュータにおいてはもっとも性能向上に寄与する。

 さらに、DDR4メモリを採用することで、消費電力の低減につながっている。DDR4では動作電圧が1.2Vとなっており、省電力機能を利用することで、DDR3に比べると最大40%も消費電力を低減することができる。これは、大量のメモリを搭載するサーバー用途においては、運用上の大きなメリットになるだろう。消費電力の低減により、サーバーを入れ替えても、新しいクーリングシステムなどは必要にならない。

 またDDR4メモリは、DDR3よりもメモリ容量が大きいものが開発されている。現状では32GBだが、来年には64GB、128GBのメモリモジュール提供も計画されている。

Xeon E5-1600/2600 v3で改良された機能。特にDDR4メモリと最大18コア搭載が目立つ
DDR4メモリにより性能アップと省電力が図られた

 CPUコア自体に関しては、分岐予測の改善、バッファの容量増加、フロントエンド性能の向上などが行われているが、なんといっても注目に値するのは最大サポートコア数だ。

 Haswell世代のXeon E5では、最大18コアとなっている。さらにハイパースレッディングを利用すれは、36スレッドのプロセッサとなる。2ソケットサーバーならば、36コア/72スレッドのサーバーが構成できる計算だ。

 2ソケットサーバーでこれだけのコア数を搭載できるプロセッサがリリースされると、今後、仮想化などによるさらなるサーバー集約が可能になったり、大規模なプライベートクラウドやパブリッククラウドが提供されるようになったりするだろう。価格面は前世代とほぼ変わらないため、ハードウェア一新により集約できる仮想マシン数が増えることで、パブリッククラウドなどの利用料金もさらに安くなるだろう。

Ivy Bridge世代とHaswell世代の差。メモリやコア数以外に、AVX 2.0、QPIの性能アップ、電力制御などが強化されている。
Haswell世代のマイクロアーキテクチャでは、コアをIvy Bridge世代から10%性能向上したほか、AVX 2.0サポートなど、細かな性能向上を行っている

 LLC(ラスト レベル キャッシュ)は、Haswell世代のXeon E5ではコアあたり2.5MBが搭載されるので、18コアで最大45MBとなる。

 これだけのLLCを効率的にアクセスするため、プロセッサ内部では、コアを2つのグループに分けて、それぞれのグループに高速な双方向性バスを用意している。また2つのグループ間を接続するのに、専用のバススイッチを利用する。

 ただし、すべてのHaswell世代のXeon E5の内部バスが同じようになっているわけではない。コア数によって3種類に分かれている。

 14~18コアと10~12コアの大中規模なコア数は、前述の様にコアを2グループに分けているが、14~18コアと10~12コアでは、2つのグループの接続されているコアの数が異なっている。4~8コアでは、コアをグループに分けずに1つのグループとして、双方向のリングバスで接続されている。

Haswell世代のXeonでは、内部バスが変更されている
Haswell世代のXeonでは、コア数に応じて3種類のダイと内部バスが用意されている

 また、コアが2グループに分かれてLLCに接続されている10コア以上のプロセッサでは、COD(Cluster On Die)モードが用意された。このモードでは、各グループの近くに用意されているLLCメモリをできるだけ利用することで、キャッシュのヒット率を向上させたり、メモリレイテンシを低くしたりするようにしている。プロセッサ内部のコアにおいても、NUMAアーキテクチャに最適化されている。

CODモードでは、LLCレベルでコアを2つのグループに分けている。これにより、コアに近い位置にLLCを用意することで、キャッシュのヒット率などをアップする

 このほかの機能としては、ディレクトリ・キャッシュのサポート、AVX 2.0の動作を高速化するターボ ブースト テクノロジー2.0(今まではAVXと演算コアが同時にブーストされていたが、今回から個別に設定されている)などがサポートされている。

 また、プロセッサに統合電圧レギュレーター(IVR)が搭載されたことで、コア部分やアンコア部分を非常に細かく電源操作ができるようになった。これにより、省電力性能もアップしている。

IVRにより、細かな電源コントロールがコアごとに可能になった。これにより、省電力性が高まった
PCPSによってコアごとの電力効率が向上した
Haswell世代では、ハードウェアで暗号化機能がサポートされたことで、パフォーマンスが向上している

(山本 雅史)