IDF 2011サンフランシスコから、サーバー向け次期メインストリームCPU「Xeon E5」を見る

　今回は、9月13日から3日間、米国サンフランシスコで開催されたIntelの開発者セミナー「IDF（Intel Developer Forum） 2011」の資料をもとに、今後のサーバーCPUのロードマップを解説していく。

■サーバー市場向けのメインストリームがポカリと空いていた

　サーバー市場で待ち望まれているのが、2プロセッサをサポートするXeon E5シリーズだ。Xeon E5シリーズは、現在サーバー市場でメインストリームとなっているXeon 5500/5600シリーズを置き換えるCPUだ。

　Xeon E5シリーズは、今年の1月にリリースされた、32nmプロセスで製造されたデスクトップ用の第2世代Core iシリーズCPU（コード名：Sandy Bridge）をベースに開発されている。

　Sandy BridgeベースのXeonとしては、4月にXeon E3 1200シリーズがリリースされている。Xeon E3 1200シリーズは、デスクトップの第2世代Core iシリーズを流用したモノだ。CPUソケットも、デスクトップ用CPUと同じLGA 1155が採用されている。一部のCPUでは、第2世代Core iシリーズに搭載されているグラフィック部分をオフにして、低消費電力化している。

　バリエーションも4コア/8スレッド（HTあり）から、4コア/4スレッド（HTなし）、2コア/4スレッド（HTあり）までリリースされている。ちょうど、デスクトップCPUのCore i7、Core i5、Core i3に対応する。Core i3ベースのXeon E3 1220Lは、2コア/4スレッドで20Wという、サーバーにしては信じられないほどの低消費電力だ。

　同時期にリリースされた、Xeon E7シリーズは、Sandy Bridge世代よりも1つ古いWestmere世代のCPUアーキテクチャを採用している。最大10コア/20スレッドに対応しており、ミッションクリティカル用途に向けたハイエンドサーバー向けのCPUだ（製造プロセスは32nm）。

　最も売れ筋のサーバーに向けたCPUが、ある意味、ポカリと空いている状況だった。これが、Xeon E5シリーズが登場することを大きく変わる。

■8コア/16スレッドに対応したメインストリーム向けのXeon E5

Xeon E5シリーズは、8コア/16スレッド、AVX命令、AES命令を搭載している。さらに、対応するチップセットでは、6Gbps SASをサポートする（IDF2011のプレゼンテーション資料より。以下同じ）

Xeon E5シリーズのCPUアーキテクチャ。デスクトップのSandy Bridgeと異なるのは、CPUコア数を倍増したことと、内蔵グラフィックが取り外されていることだ

　Xeon E5シリーズ（コード名：Sandy Bridge-EP）では、Xeon E3シリーズとは異なり、CPUの設計が変更されている。Intelでは、第1世代Core iシリーズ（コード名：Nehalem）から、CPUコアの部分にモジュール構造を採用している。

　このため、全く新たにサーバー用CPUを設計するのに比べると、デスクトップ用CPUの設計を流用して、短期間にリリースできるとしていた。今回リリースするXeon E5シリーズは、デスクトップCPUから見ると、ある程度設計に手が入っている。

　まず、Xeon E5シリーズは、最大8コア/16スレッドになっている。3次キャッシュメモリは、Sandy Bridge世代と同じく、リングバスで接続された共有キャッシュメモリのアーキテクチャを採用した。これにより、膨大な容量が搭載される3次キャッシュメモリのアクセス性能をアップしている。

　また、デスクトップ用Sandy Bridge世代のCPUと比べると、リングバスに接続されるCPUコア数が2倍になっている。一方、内蔵グラフィックに関しては、Xeon E5シリーズではすべて取り外され、その分、コア数が増えている。

　さらに、メモリ関連に改良された。Xeon E3 1200シリーズでは2チャンネルだった。Xeon E5シリーズでは、4チャンネルに倍増すると見られる。メモリアクセスのバンド幅を大幅にアップするすることで、システム全体の性能がアップする。

　これに伴い、Xeon E5シリーズでは、LGA 2011が採用され、現在のXeon E3 1200シリーズのLGA 1155に比べると、ピン数が大幅に増えるようだ。

　Xeon E5シリーズは、Sandy Bridge世代のため、新しいSIMD拡張命令のIntel AVXがサポートされている。AVXは、今まで128ビット幅だったSIMD命令（SSE命令）を一新し、256ビット幅で作り直されている。このため、AVX命令は既存のSSE命令とは全く互換性がない（Sandy Bridge世代では、AVXとSSEの両ハードウェアがサポートされいる）。

　Intelでは、性能向上を考えて、ソフトウェアがSSEからAVXへと移行するように促進している。AVXの応用分野としては、動画のエンコードなどのマルチメディア処理の高速化などがいわれている。エンタープライズのアプリケーション分野においては、すぐにメリットがでるアプリケーションはすぐに思い浮かばない。このため、企業のアプリケーションにおいて、本格的にAVXがサポートされるのは、時間がかかるだろう。

　HPC分野では積極的に利用されるかもしれないが、一般の企業においては、CPUコア数が増え、仮想化の性能が向上することなどの方が、メリットが大きいだろう。

　Xeon E5は、2ソケット版と1ソケット版が用意されると見られている。2ソケット版を利用すれば、16コア/32スレッドのサーバーシステムとなる。数年前には、ミッションクリティカル向けの数千万円したサーバーが、百数十万円で購入できることになる。メインメモリに関しても、1TBぐらいは搭載できるようになるだろう。

　これだけの性能を持つサーバーは、仮想化ありきとなるのではないか。特に、5～１0年前にx86サーバーを導入した企業は、ハードウェアのリプレース時期を迎えているため、複数のサーバーを仮想化して集約するだけで、メンテナンスコストが大きく浮くことになる。また、多くの企業が採用するプライベートクラウドのハードウェア基盤としても利用できるだろう。


Xeon E5シリーズでは、Romleyというコードネームのプラットフォーム名がつけられている。CPU同士は、QPIで接続され、2ソケットサーバーが構築されている	Xeon E5シリーズは、以前のXeon 5500番台に比べると2倍以上の性能を持っている

■Xeonも2012年にはIvy Bridgeへと移行

　今回のIDFでは、Sandy Bridgeの次世代CPUにあたるIvy Bridgeに関しても説明された。基本的には、デスクトップ向けのバリエーションが説明されたが、そこからサーバー向けの機能も見えてくる。

　最近のIntelは、チックタック（Tick Tack）と呼んでいるCPU戦略をとっている。1年ごとに、チックとタックを繰り返す。チックの年には、CPUのアーキテクチャはそのままに、製造プロセスを微細化することで、省電力化を果たしている。タックの年は、CPUのマイクロアーキテクチャを一新し、新しい命令セットなどを導入している。

　今回のIvy Bridgeは、製造プロセスに22nmを採用している。また、22nmプロセスから3D型の新しいトランジスタ「Tri-Gate」を採用している。Tri-Gateの採用により、リーク電流が少なくなり、CPUの消費電力が非常に小さくなる。実際、IDFの基調講演では、名刺大の太陽光パネルで動作するCPUもデモされていた。


2012年にリリースされるIvy Bridgeのブロック図。Sandy Bridgeとデザイン自体はそれほど変わらない	Ivy Bridgeのダイ写真

Intelでは、製造プロセスの微細化を進め、2011年（実際に製品としてのリリースは2012年）には22nm、2013年には14nmを実現する	22nmを使用するIvy Bridgeでは、省電力化と性能向上を両立させている

　さらに、Intelでは、Ivy Bridgeを単なるプロセスシュリンク版CPU（チックモデル）ではなく、チック＋として位置付け、いくつかの改良を行っている。大幅に改良されたのは、内蔵グラフィックの部分だ。

　Sandy Bridgeでは、DirectX 10世代のサポートとなっていた。NVIDIAやAMDは、DirectX 11世代に進んでいたのに、DirectXの世代では、Intelは少し後れをとることになったわけだ。

　そこで、Ivy Bridgeでは、DirectX 11をサポートするように改良されている。単にDirectX 11をサポートしただけでなく、GPUの演算ユニットを増やすことで、内蔵グラフィック自体の性能を向上している。

　エンタープライズにおいては、内蔵グラフィックの機能強化はあまりメリットはないだろう。ただ、デスクトップと同じCPUを使ったエントリー向けのサーバーにおいては、グラフィック機能が内蔵されるため、よりローコストでサーバーが発売されるようになるだろう。


Ivy Bridgeでは、内蔵グラフィックが大幅に強化されている	Ivy Bridgeの内蔵グラフィックは、DirectX 11をサポートする

　このほか、CPUコア自体も改良が加えられて性能が向上しているし、ハードウェアによる乱数生成機能、スーパーバイザーモード実行プロテクション機能（SMEP）も追加されている。省電力化では、電源制御回路の改良により、より細かな電力制御が可能になっている。

　SMEPは、ハードウェアによる改ざん防止機能だ。この機能は、悪意のあるソフトが、特権モードに昇格してセキュリティアタックを行うことを防止するものである。


Ivy Bridgeで搭載される乱数のハードウェア生成機能。高速に、乱数を生成することが可能になる	SMEPは、ハードウェアでハッキングを防止する機能

　Ivy Bridgeにおいても、サーバーのメインストリームは2ソケット版となるだろう。製造プロセスを微細化しているため、Sandy BridgeよりもCPUコアが搭載できる可能性が高い。Sandy Bridgeでは、8コア/16スレッドだが、10コア/20スレッドが当たり前になるかもしれない。

　さらに期待されるのは、省電力化だ。新しいトランジスタTri-Gateを採用することで、CPUの消費電力が小さくなる。また、リーク電流が少なくなるため、アイドル時の消費電力が少なくなるだろう。もしかすると、TDPに余裕があるときに、一時的にクロックアップして動かすTurboBoostもより高いクロック数で動作するようになるかもしれない。


Intelが22nmプロセスで採用するTri-Gate。今までのPlanarトランジスタとは、大きく形が異なる	電子顕微鏡写真からでも、Tri-GateとPlanarトランジスタの形状が異なることがよくわかる	Tri-Gateは、性能でも、低消費電力性でも優れている

　例年、Intelのデスクトップ向けCPUは、1月に開催されるCES（コンシューマーエレクトニックスショー）で発表され、そのCPUを搭載したPCがすぐに発売される流れになっている。Ivy Bridgeも、これと同じようなスケジュールをたどるのではないか。

　サーバー向けのIvy Bridgeとしては、デスクトップと同じ仕様のCPUが、2012年春ごろまでにリリースされ、サーバー市場のメインストリームとなる2ソケット仕様は、2012年末までにリリースされることになるだろう。

　Intelは、2013年にリリースが予定されているタック世代のCPUとして、Haswell（開発コード名）の開発を進めている。Haswellでは、さらに省電力化を進めており、現在の第2世代Core iシリーズに比べプラットフォームベースでは、消費電力を1/20以下にする予定だ。

次々世代のHaswellでは、大幅に消費電力を低下させながら、性能をアップしていく

　サーバー市場においては、Xeon E5シリーズの発表が待望されている。ただ、エンドユーザーにとっては、これだけの性能とCPUコアを持つCPUを単なるサーバーのリプレースで利用するのではなく、仮想化を前提としたプライベートクラウドの構築に役立てるべきだろう。

　Intelでも、プライベートクラウドを前提として、10Gigabit Ethernetの標準採用、ネットワークの仮想化といった部分にまで踏み出している。ある意味、Xeon E5シリーズは、企業のデータセンターをプライベートクラウド、ハイブリッドクラウドへと大きく進化させるターニングポイントになるかもしれない。