アンコアを大幅に進化させ、処理能力と電力効率を改善したXeon E5 2600シリーズ

~Sandy Bridge-EPがついにサーバー/ワークステーション市場に登場


 これまで開発コードネームSandy Bridge-EP(サンディブリッジイーピー)で開発されてきた、Intelのサーバー、ワークステーション向けプロセッサーが、XeonプロセッサーE5 2600シリーズ(以下Xeon E5 2600)として3月6日(現地時間)に発表された。Xeon E5 2600シリーズは現行製品Xeonプロセッサー5600シリーズ(以下Xeon 5600)の後継製品として投入され、Intelの2ソケット向けサーバープロセッサーとして市場に投入される。

 Xeon E5 2600は、従来製品に比べて、新命令セットAVXに対応しコア数が6から8に増やされるなど内蔵されているIAプロセッサーコアそのものも強化されているが、メモリコントローラがトリプロチャネルからクアッドチャネルへとチャネル数が増やされ、40レーンのPCI Express Gen3に対応するなどコア以外の部分(アンコア)が強化されているのが大きな特徴になっており、2ソケットサーバー市場での競争力を大きく強化する製品となる。

 今回のレポートでは、そうしたIntelの新しいXeon E5 2600シリーズの技術的な詳細に関して、紹介していきたい。Intelのアーキテクトが「開発開始から発表までに5~6年かかった」というモンスターチップは、前世代と比較してダイサイズがほぼ倍になり、性能で80%、電力効率は70%も改善されているという。


TICK-TOCK開発モデルのTOCKに相当するSandy Bridge-EP

 Intelのプロセッサー開発は、TICK-TOCK(チック-タック)モデルと呼ばれる開発モデルが導入されていることがよく知られている。

【図1】IntelのTICK-TOCKモデル(Broadwell以降は筆者予想)

 そのことを説明するためには、プロセッサーの開発というのが、製造プロセスルールと呼ばれる半導体を製造する製造技術と密接にかかわっていることを説明しなければならない。

 よくプロセッサーの解説記事などに登場する「45nm」や「32nm」という表記は、この製造プロセスルールを表している。そのプロセスルール世代のトランジスタ(半導体の最小単位、電気的なスイッチのこと)のサイズを示しているのがこの数字だ。45nmであれば、トランジスタのゲートと呼ばれる部分の長さが45nm(nm=ナノメートル、1nmは1/10億メートル)であることを意味している。

 この数字が小さければ小さいほど、トランジスタ1個あたりのサイズは小さくなるので、同じ面積の半導体の中に詰め込めるトランジスタの数を増やすことができることになる。つまり、45nmプロセスルールで製造する半導体と、32nmプロセスルールで製造する半導体が同じ面積で製造されれば、32nmの方がトランジスタをより多く詰めむことが可能になり、半導体としてより高い性能を実現することが出来るようになる。このため半導体メーカーは、競ってより微細な製造技術を導入しているのだ。

 この製造技術において、Intelのような最先端を走るメーカーは2年に1度新しい技術を導入する。実際、2年前の2010年には32nmが導入され、2012年には22nmという新しい技術が導入される。Intelもそうした製造技術の進化に合わせて製品展開を行っているが、それだけではなく、同じ製造技術でも2つの種類の製品を導入している。

 それが、上図にあげた「TICK」にあたる製品で、新しい製造技術が導入された時に投入される製品だ。このTICKは、マイクロアーキテクチャと呼ばれるプロセッサーのハードウェアの仕様はほぼ前世代と一緒だが、製造技術だけが進化した製品という位置づけになる。これに対してTOCKでは、TICKと製造技術は同じだが、プロセッサーのハードウェアの仕様が大きく代わり、性能が前世代に比べて大きく強化される製品となる。

 IntelがこうしたTICK-TOCKモデルの開発方式を採用している背景には、1つには新しいマイクロアーキテクチャと新しいプロセスルールの導入が同じタイミングになることを避けるということがある。プロセッサーの開発には、以下の2つを同時に進めていく必要があるが、2つを同時に新しくすれば開発リスクは倍増する。TICK-TOCKモデルの開発方式を採用するのは、こうしたリスクをコントロールする目的があると考えられている。

・マイクロアーキテクチャの開発
・より新しいプロセス技術へのマイグレーション

 今回IntelがXeon E5 2600シリーズとして発表したSandy Bridge-EPは、TICK-TOCKモデルのうち、TOCKに相当する製品となる。Sandy Bridge-EPは、製造プロセスルールは前世代となるXeon 5600(Westmere-EP)で導入された32nmプロセスルールが採用されているが、マイクロアーキテクチャは完全に新設計となるからだ。


EX、EP、ENが存在するサーバー向けのIntelプロセッサー

 Intelは、Nehalem(ネハレム、45nm世代のTOCK)以降、サーバー/ワークステーション向けのプロセッサーにはコードネームの末尾につけられる2文字の違いで、3つのダイバリエーションを用意している。それがEX、EP、ENの3種類になる。

【表1】EX、EP、ENの違い
 ソケット数対象市場
EX4以上大規模サーバー向け
EP1~2デュアルソケットなどメインストリームサーバー向け
EN1~2シングルソケットなどエントリーサーバー向け

 世代により若干の差はあるものの、わかりやすく言えば、EXは4ソケット以上のソケットを採用するような大規模サーバー向け、EPはシングル/デュアルソケット(主にデュアル)のサーバー、ENはシングル/デュアルソケット(主にシングル)のサーバー向けという位置づけの違いがあるほか、プロセッサーの仕様もそれぞれ異なっているのだ。

 今回発表されたXeon E5 2600シリーズは、その開発コードネームSandy Bridge-EPからもわかるように、EP、つまり2ソケット向けの製品となる。

 なお、Sandy Bridge-ENはすでにXeon E3として昨年発表されており、すでに市場には搭載製品が多数出回っている。では、今回Sandy Bridge-EPが発表されたことで、Sandy Bridge-EXはどうなったのかという疑問がでてくると思うが、実はSandy Bridge-EXは製品としては存在していない。正しくは、Sandy Bridge-EXも製品計画としては存在しており、かなりのところまで開発は進んでいた。しかし、Intelは今年、22nmプロセスルールに微細化したIvy Bridge世代の製品を投入することになった。

 Sandy Bridge-EPも元々は2011年中の発表だったものがこのタイミングまで若干遅れてしまったということもあり、これからSandy Bridge-EXを投入したとしても、Ivy Bridge世代のEXとかなり近いタイミングになってしまうということが予想されるため、Sandy Bridge-EXの計画はキャンセルされ、代わりにそのリソースはIvy Bridge-EXの開発に投入されることが決定されたのだ。

 このため、4ソケット向け製品としては、現行のNehalem-EXベースの製品が継続販売される他、今後Sandy Bridge-EPベースの4ソケット版も登場する見通しで、4ソケット以上の製品を計画している場合には、そちらを選択することになるだろう。


ダイサイズが従来製品の倍になっているXeon E5 2600

 以下の図2、図3、表2は今回発表されたXeon E5 2600と、従来製品Xeon 5600をブロック図とスペックで比較したものだ。

【図2】Xeon E5 2600のブロック図【図3】Xeon 5600のブロック図

【表2】Xeon 5600とXeon E5 2600のスペック
製品ブランドXeon 5600Xeon E5 2600
開発コードネームWestmere-EPSandy Bridge-EP
プロセッサーマイクロアーキテクチャNehalemSandy Bridge
製造プロセスルール32nm32nm
CPUソケットLGA1366LGA2011
コアダイサイズ240平方mm416平方mm
トランジスタ数11億7000万22億7000万
最大コア数/スレッド/ダイ6/128/16
AVX対応
LLC12MB20MB
メモリメモリチャネル3ch4ch
メモリクロック最大1333MT/秒最大1600MT/秒
最大メモリ容量288GB768GB
メモリ帯域32GB/秒51GB/秒
電圧1.5/1.35V1.5/1.35V
RDIMM
LRDIMM
I/OQPI2ch2ch
QPI帯域6.4GT/秒8GT/秒
PCI Express内蔵40レーン(Gen3)
+4レーン(Gen2/DMI)

 まず目につくのは、同じ32nmの製造プロセスルールで製造されているのに、ダイサイズが大きく異なっていることだろう。Westmere-EPでは、Xeon 5600シリーズのダイサイズは240平方mmとクライアント向けのプロセッサーよりもやや大きめ程度に収まっているが、Sandy Bridge-EPことXeon E5 2600のダイサイズは416平方mmとかなり大型になっている。

 このため、トランジスタ数は11億7千万から22億7千万とほぼ倍増しており、これだけでも新しいXeon E5 2600が強力なプロセッサーであることがわかるだろう。

 Xeon E5 2600は、ダイサイズが大きくなっているわりに消費電力に関しては微増に止まる。後述するが、TDP(Thermal Design Power)と呼ばれる、熱設計時に参照するピーク電力は最上位グレードで135Wとわずかに増えているものの、アベレージパワーと呼ばれる、アクティブ時の消費電力に関しては従来製品とほぼ同じか、むしろ減っているという。Xeon E5 2600では、ダイサイズが増加しているのに、消費電力を抑えることが可能なように、数々の新しい省電力のテクニックが実装されており、これもXeon E5 2600の大きな特徴の1つになっている。

 さて、増えたトランジスタはどのような機能強化に使われているのだろうか。

 一般的に、プロセッサーの機能強化と言えばプロセッサーのコア数を増やしたり、キャッシュの容量を増やしたりということになるだろう。Xeon E5 2600でも、そのあたりの強化は行われており、内蔵されているコアは6から8に、LLC(Last Level cache、L3キャッシュのこと)は12MBから20MBへと強化されている。

 だが、この強化点はXeon E5 2600の特徴の半分でしかない。Intelのアーキテクトは、今回のXeon E5 2600を設計するにあたり、“アンコア(Uncore)”と呼ばれるコア以外の部分の機能強化に注力したと説明している。アンコアとは、プロセッサーコアやキャッシュなどのプロセッサーとしの主要部分以外のブロックのことを意味しており、メモリコントローラやI/Oコントローラなどの部分を指す。これらの部分の強化がXeon E5 2600の性能底上げに大きく貢献しているのだ。


プロセッサーの内部構造はSandy Bridgeの特徴を継承

 Xeon E5 2600のコア部分は、すでに述べたとおり、8コアで、LLC(Last Level Cache、いわゆるL3キャッシュ)が20MBという構成になっている(SKUによっては6/4コアだったり、LLCが少ない場合もある)。コアの内部構造は、第2世代Coreプロセッサー・ファミリーとしてクライアント向けに出荷されているSandy Bridgeと同じ構造になっている。プロセッサー内部に超高速なリングバスと呼ばれる双方向の高速バスが通っており、プロセッサーコア、キャッシュ、PCI Expressスイッチ、QPIエージェント、メモリコントローラなどがリングバスで接続されている。

【図4】Sandy Bridge世代では分岐予測精度の改善、さらにはマイクロOpsキャッシュの追加などでコアの効率が改善されている【図5】Sandy Bridge世代ではでは1クロックサイクルでロードが2つ同時に行えるようになっている

 プロセッサーコアは、従来世代から大きな変更は受けていないが、いくつかの効率改善が行われている。

 x86プロセッサーでは、分岐予測精度が性能を向上する鍵の1つとなっており、分岐予測精度は従来世代よりやや改善されている。また、マイクロOpsキャッシュと呼ばれるx86命令を内部命令に変換したあとキャッシュしておく一種のキャッシュが追加されており、キャッシュにヒットした場合多くの消費電力を必要とするx86命令のデコードをしなくても演算が可能になる。

 さらに、データのロード、ストアに関しても改善が図られており、従来世代では1クロックサイクルあたり1ストア、1ロードだったのが、Xeon E5 2600では1クロックサイクルで2ロードが可能になっており、多くのアプリケーションで演算性能が向上する。なお、このあたりの改善は、デスクトップPCやノートPC向けのSandy Bridgeと同じレベルの改善となっている。

【図6】AVX命令を利用することで、1クロックサイクルで256ビットの精度で浮動小数点演算が可能になる。これは従来のSSE4の128ビットに比べて倍の精度を1クロックで演算可能な計算になる

 さらに、Xeon E5 2600はAVX(Advanced Vector eXtentions)と呼ばれる新しい拡張命令セットに対応している。AVXを利用すると、従来はSSE命令を利用して1クロックあたり128ビット単位でしか演算できなかった浮動小数点演算が、1クロックあたり256ビット単位で演算することができるようになる。アプリケーションがAVX命令を効率よく使えば、従来の倍の速度で演算することが可能になるだけに効果は非常に大きい。

 L3キャッシュに相当するLLCだが、各コアあたり2.5MBが用意されており、プロセッサーコアと同クロックで動作する。容量が20MBと大幅に増えたことで、キャッシュにヒットする可能性は従来製品に比べて高まっている。また、リングバスを採用したことで、コアからLLCへの読み込み時のスループットは3.3GHz動作時で250GB/秒にも達することになり、レイテンシだけでなく帯域の観点でも大きな意味がある。


アンコア強化点は、QPI、メモリ、I/O周りが大きく強化されている

 アンコア部分の強化点は大きく3つのポイントがある。それがQPI、メモリコントローラ、I/O周りだ。

【図7】QPIではデータ転送レートが6.4GT/秒から8GT/秒へと高められている

 QPI(Quick Path Interconnect)は、Nehalem世代から導入された、プロセッサー間、ないしはプロセッサー―チップセット間をポイントツーポイントで接続する技術の総称だ。それ以前は、FSB(Front Side Bus)と呼ばれる1990年代から利用されているような旧式のバスを採用していたのだが、1パッケージに実装されるコア数が増えると、複数コア間のキャッシュの同期(キャッシュコヒーレンシ)を取るのに帯域幅が十分ではないなどの問題が浮上しつつあった。そこで、QPIでは高速なシリアルバスで2点間をポイントツーポイントで接続し、コヒーレンシーなどを十分な帯域で行えるようになった。

 Xeon 5600世代のプロセッサーでは、QPIのコントローラは2つが搭載されており、【図3】のように、1つは2つのプロセッサー間、もう1つはチップセットのノースブリッジとがそれぞれ接続される形状で接続されていた。これは、従来製品ではPCI Expressスイッチはプロセッサー側ではなく、チップセットのノースブリッジ側にあったためで、3点間をそれぞれ接続する必要があったのだ。

 これに対してXeon E5 2600では、PCI Expressスイッチはプロセッサー側に内蔵されているため、従来製品と同じくQPIコントローラは2つだが、いずれもプロセッサー間の接続に利用することができる。かつ、転送速度自体も引き上げられており、従来製品が6.4GT/秒だったのに対して、Xeon E5 2600では8GT/秒になっている。これにより、プロセッサー間でのコヒーレンシや相手側のプロセッサーに接続されているPCI Expressデバイスなどへのアクセスをより高速に行うことが可能になっているのだ。

 メモリコントローラの強化もXeon E5 2600の大きな特徴だ。従来製品ではメモリコントローラはトリプルチャネル構成だったが、Xeon E5 2600ではクアッドチャネルに強化されている。さらに、メモリデバイスの動作周波数も、従来製品では1333MHzまでだったものが、Xeon E5 2600では1600MHzまでサポートと拡張されている。これにより、DDR3-1600のメモリモジュールを利用した場合、1チャネルあたり12.8G/秒の帯域幅となるため、12.8GB/秒X4=51.2GB/秒の帯域幅を実現することになる。

【図8】LRDIMMではバッファーをメモリモジュール上に搭載することで、DIMM上に搭載できるDRAMの数を増やすことができる

 さらに、メモリに関してはサーバー/ワークステーション市場で一般的に利用されているRDIMM(Registered DIMM)だけでなく、LRDIMM(Load-Reduced DIMM)のサポートも追加されている。

 LRDIMMは、バッファチップを搭載することで実装できるメモリデバイスの数を増やすタイプのメモリモジュールで、1つのメモリモジュールあたり実装できるメモリ容量を増やすことができる技術として注目を集めている。

 すでにSamsung Electronicsなどが製品化に踏み切っており、4GbのDRAMを利用して32GBというモジュールを実現可能にしている。これを利用すれば、Xeon E5 2600の768GBというメモリを1枚のマザーボード上に実装することが可能になるのだ。ただし、現状ではLRDIMMにはコストプレミアムがあり、かつXeon E5 2600では最大で1333MHzまでのサポートになる。このため、性能よりも、メモリ容量の多さが優先というサーバーでの選択肢ということになるだろう。


プロセッサーに統合されたI/O機能により、プロセッサーへ直接データを転送

 すでに述べてきたように、Xeon E5 2600の特徴は“アンコア”の強化にあるが、その最大の強化点がI/O周りのプロセッサーコアへの統合だ。

 具体的には、従来製品ではチップセットのノースブリッジにあったPCI Expressスイッチが、プロセッサーコアにIIO(Integrated I/O)という名前で統合されている。Xeon E5 2600のIIOは、40レーンのPCI Express Gen3を標準でサポートしている。Gen3は、最新のPCI Expressの仕様で、レーンあたり2Gbps(双方向)と、従来のGen2の1Gbps(双方向)の倍の帯域幅を実現している。

 ただし、当然ながらデバイス自体もGen3に対応していなければ意味がない。現時点ではGen3に対応しているのが一部のGPUだけあることを考えると、現時点では大きな意味はないが、将来的にGen3に対応した10Gbイーサネットコントローラなどが登場すれば、少ないレーン数でも充分に対応することが可能になるだけに、対応デバイス次第ということになるだろう。

【図9】Xeon E5 2600のPCI Expressスイッチの構成

 Xeon E5 2600のPCI Express(Gen3)スイッチは、内部的にはx16(x8/x8ないしはx4/x4/x4/x4に分割可能)が2つ、x8(x4/x4に分割可能)という構造になっており、内部的にはVT-dのI/Oアクセラレーションにも対応したスイッチにより切り換えて利用することが可能だ。さらに、Gen2のPCI Express x4が1ポート用意されており、チップセット(Intel C600)を接続するプロセッサーではDMI(Direct Media Interface)を接続するバスとして、チップセットを接続しない場合には一般的なPCI Express x4(Gen2)として利用することができる。この他、PCI ExpressのHotPlugにも対応している。

【図10】IntelのDDIOの仕組み。通常であればPCI Expressから来たデータは1度メモリへ格納されるためメモリへのアクセスが生じるところを、キャッシュに格納することでメモリへのアクセスを減らすことができる

 さらに、IntelはDDIO(Data Direct I/O)と呼ばれる仕組みを導入する。このDDIOは、Xeon E5 2600のPCI Expressなどで接続された10Gbイーサネットなどが対象になり、PCI Express経由でやってくるデータを直接プロセッサーのLLC(L3キャッシュ)へとDMAの仕組みを活用してコピーする。

 通常であれば、プロセッサーがPCI Expressなどの外部デバイスのデータへアクセスする場合、リクエストが発生してからメインメモリにコピーされ、その後内部キャッシュへとコピーされるため、演算器はデータがメモリからキャッシュへ読み出される時間だけ待つことになり、ストールが発生し処理能力が低下する。

 しかし、DDIOでは直接LLCへとデータが読み込まれてるため、演算器の待ち時間はほとんどなく処理が可能になるのだ。さらに、これによりデータがメモリへコピーされることもなくなるため、消費電力の削減も実現される。このDDIOは、OEMメーカーなどに出荷状態で標準で有効になっている。ハードウェアやソフトウェアなどには依存しないため、自動で有効になる。

 IntelはXeon E5 2600のリリースに合わせて10GbイーサネットのコントローラとなるIntel Ethernet Controller X540(開発コードネームTwinville)をリリースするが、もちろんX540でもDDIOはサポートされる。Intelが公開したデータによれば、DDIOを利用することで、消費電力や帯域幅の節約が可能になっており、I/O周りのアクセスが頻繁にある環境では大きな効果を期待できそうだ。


プロセッサーが自立的に消費電力をコントロールするユニークな省電力機能

 このように、Xeon E5 2600は、ダイサイズを大きくすることでその増えたトランジスタを活用して、コア部分だけでなくアンコアの部分も大きく機能拡張しているのが大きな特徴となっている。しかし、すでに述べたように、ダイサイズが大きくなり、トランジスタが増えるということは、本来であれば消費電力の増加とイコールになる。つまり、機能が増えた分だけ、消費電力が増えてしまうという事態を招きかねないわけだ。

 そこで、IntelはXeon E5 2600を開発するにあたり、様々な省電力機能を実装し、結果的に消費電力を抑えることに成功している。というのも、従来製品でもトップグレードのTDP(熱設計消費電力、熱設計時に参照するピーク時消費電力)は130Wからわずか5W増加の135Wに止まっており、さらに、他のSKUでは130Wや115W、95Wといった従来製品とほとんど同じレベルに収まっている。トランジスタ数が倍になっているという事情を勘案すれば、この程度で収まっていることは充分驚きに値すると言ってよい。


【図11】アンコア部分もコアのクロック周波数/電圧と同期して動作する。これにより高負荷時には性能を限界まで発揮し、低負荷時にはクロック周波数や電圧を下げることができ省電力を実現できる

 Xeon E5 2600に実装されている省電力技術は、基本的には細かいことの積み上げだ。プロセッサーへ供給する電圧変換機の効率を見直したり、I/O周りの省電力を細かく行うようにしたりして、使っていない部分への電力供給をできるだけ押さえるようになっている。また、Nehalem世代では、プロセッサーコアとアンコア(内部バス/キャッシュ)は非同期になっており、プロセッサーコアが低い電力モードで動いている時にもアンコアはそれなりの電力を消費していたのだが、Xeon E5 2600ではキャッシュやリングバスに関してもコアと同じ電圧/動作周波数で同期して動くようになっており、プロセッサーが低い電力モードへ移行している時には同じようにアンコア部分も低消費電力モードへと移行することができる。

【図12】Xeon E5 2600ではプロセッサーの動作モードを、高負荷時にはパフォーマンスモードに、低負荷時にはバランスモードに動的に切り換える

 また、Xeon E5 2600ではプロセッサーの動作設定モードを動的に切り換える事ができる。通常、OS側のACPI設定などによりパフォーマンスモード、バランスモード、パワーセービングモードなどにプロセッサーの省電力切り換えて利用するになっている。

 通常であれば、パワーセービングモードに設定している場合には、最も負荷が高い状態でもパフォーマンスモードに比べてプロセッサーの処理能力は若干低下する。しかし、Xeon E5 2600では負荷が高くなればプロセッサーの内部で自動的にパフォーマンスモードに動的に切り換える。これにより、低負荷の時にはパワーセービングモードの低消費電力で動かせ、高負荷時にはプロセッサー本来の性能を発揮させることができる。

【図13】RAPLを利用することで、あらかじめブレード単位での消費電力の予測が立てやすいため、ラックあたりに格納できるブレードの数を増やすことができる

 さらに、RAPL(Runing Average Power Limit)はユニークな機能だ。簡単に言ってしまえば、プロセッサー自身に自分の消費電力を監視させ、あらかじめ設定しておいた電力に達した場合には、それ以上消費しないようにプロセッサー自身がコントロールする仕組みだ。このため、IntelはXeon E5 2600のプロセッサー内部に100を超えるセンサーを内蔵させており、それを利用してCPUソケットとDIMMソケット単位で消費電力を一定値に抑えることが可能になっている。

 これにより、ラックあたりの消費電力の予測が立てやすくなり、従来はPSUの限界に対してかなり余裕を持たせてサーバーを配置していたのに対して、RAPLに対応したサーバーではPSUの設定値ギリギリでもサーバー数を増やすことが可能になる。なお、こうした省電力関連の操作はIntelから提供されるプラットフォーム管理ソフトを利用して管理することができる。

 こうした様々な省電力機能を利用することで、Xeon E5 2600はダイサイズ(=トランジスタ数)が増大しているのに、消費電力はわずかな増加に留まっており、さらにRAPLの機能を利用することでラック辺りの密度を高めることも可能になっており、データセンター全体での効率を改善することができる。


新チップセットとなるIntel C600シリーズ・チップセット、SASは3Gbpsまでの対応

 Xeon E5 2600のチップセットはPatsburgの開発コードネームで知られてきたIntel C600シリーズ・チップセットになる。C600は完全に新設計のチップセットで、14ポートのUSB、PCI Express Gen2 x8、PCIバス、HDオーディオなどの機能を備えている。

【図14】Intel C600シリーズ・チップセット

 目玉機能は、6ポートのSATAポート(3Gbpsが4ポート、6Gbpsが2ポート)だけでなく、SAS(Serial Attached SCSI)のコントローラを8ポート内蔵していることだ。C600がサポートするSASはSAS 1.0で規定されている3Gbpsまでの対応となっており、SAS 2.0で規定されている6Gbpsは標準ではサポートされていない。Patsburgの元々の計画では6Gbpsまでの対応の予定だったのだが、Intelがバリデーション(動作検証)を進めていた結果、エンタープライズユースでの動作を保証するには不安があることがわかり、結局6Gbps対応の機能は削られ、3Gbpsまでとされることになった。

 C600のもともとの設計ではPCI Express Gen2 x4相当のDMI2だけでなく、PCI Express Gen2 x4をSASのデータ転送用として利用できる設計になっていた。つまり、DMI2の帯域だけでは、SAS 6Gbps/8ポートのデータをプロセッサーに転送するには不十分だと考えられていたからだ。しかし、前述の通りSASは3Gbpsまでになってしまったため、もう1つのPCI Express Gen2 x4はオプション扱いになっている(実際、ほとんどのOEMメーカーではこの実装はしないものとみられている)。

 なお、C600には以下のようなSKUが用意されている。

【表3】C600のSKU構成
製品ブランドXeon 5600Xeon E5 2600Xeon E5 2600Xeon E5 2600
開発コードネームPatsburg-APatsburg-BPatsburg-DPatsburg-T
SCU SATA4ポート4ポート(*)8ポート(*)8ポート(*)
SAS4ポート(*)8ポート(*)8ポート(*)
SAS RAID5オプション
(*)排他利用

 なお、SASでのRAID5はオプション扱いで、Intelより提供されるROMをマザーボード上の専用端子に挿入することで利用することが可能になる。


アーキテクチャ全体で80%の性能向上、電力効率は70%の大きな改善

 以上のように、Xeon E5 2600は、ダイサイズの増大によるトランジスタ数の増加を、コア部分だけでなくアンコアに上手く割り振り、プロセッサー全体での性能向上を実現しており、かつダイサイズ増加による消費電力の上昇を省電力機能で上手くカバーすることで、消費電力も従来製品レベルに抑えることに成功している。

 Intelによれば、アーキテクチャ全体として、前世代に比べて80%の性能向上が実現されており、かつ電力効率に関しては70%も改善されているとのことで、実際公開されたパフォーマンスデータやベンチマークからはそうしたことが裏付けられている(★別記事参照)。Xeon E5 2600には以下のようなSKUが用意されている。

【表4】Xeon E5 2600のSKU構成と価格(1,000個ロット時)
プロセッサー
ナンバー
クロック
周波数
TDPLLCコア数
/スレッド
メモリクロックTurbo
Boost
価格
(米ドル)
E5-26902.9GHz135W20MB8/161600/1333/1066/8002,057
E5-2687W3.1GHz150W20MB8/161600/1333/1066/8001,885
E5-26802.7GHz130W20MB8/161600/1333/1066/8001,723
E5-26702.6GHz115W20MB8/161600/1333/1066/8001,552
E5-26672.9GHz130W15MB6/121600/1333/1066/8001,552
E5-26652.4GHz115W20MB8/161600/1333/1066/8001,440
E5-26602.2GHz95W20MB8/161600/1333/1066/8001,329
E5-26502GHz95W20MB8/161600/1333/1066/8001,106
E5-2650L1.8GHz70W20MB8/161600/1333/1066/8001,106
E5-26433.3GHz130W10MB4/81600/1333/1066/800884
E5-26402.5GHz95W15MB6/121333/1066/800884
E5-26373GHz80W5MB2/41600/1333/1066/800884
E5-26302.3GHz95W15MB6/121333/1066/800612
E5-2630L2GHz60W15MB6/121333/1066/800662
E5-26202GHz95W15MB6/121333/1066/800406
E5-26092.4GHz80W10MB4/81066/800294
E5-26031.8GHz80W10MB4/81066/800202
E5-16603.3GHz130W15MB6/121600/1333/10661080
E5-16503.2GHz130W12MB6/121600/1333/1066583
E5-16203.6GHz130W10MB4/81600/1333/1066294

 ほとんどのSKUはサーバー向けの構成だが、Xeon E5 2687WとWが末尾についているSKUはワークステーション専用の製品となる。

 なお、Xeon E5 2600では、Nehalem世代からサポートされている“公式オーバークロック機能”と言えるIntel Turbo Boost Technologyに対応しており、電力供給に余裕がある場合には、規定のクロックよりも高いクロックで動作するようになっている。

 Xeon E5 2600では、Turbo Boost Technology 2.0と呼ばれる第2世代のTurbo Boostに対応しており、プロセッサーの温度に余裕がある場合には、TDPを超えるクロック周波数に設定することができる。これは、デスクトップPCやノートPC向けのSandy Bridgeで導入されたもので、短時間であればTDPを超えたとしても、ダイの温度が規定値を超えることがないという“差分”を利用したもので、短時間でも高いクロック周波数などに設定されるため、アプリケーションの起動時などに大きな効果がある。

 なお、Xeon E5 2600でのターボ時のクロックビンの上がり幅は以下のようになっている。

【表5】ターボ時のクロック周波数BINの上昇分
プロセッサー
ナンバー
クロック
周波数
コア数
/スレッド
1コア
動作時
2コア
動作時
3コア
動作時
4コア
動作時
5コア
動作時
6コア
動作時
7コア
動作時
8コア
動作時
E5-26902.9GHz8/16+9+7+7+5+5+4+4+4
E5-2687W3.1GHz8/16+7+5+5+4+4+3+3+3
E5-26802.7GHz8/16+8+8+7+5+5+5+4+4
E5-26702.6GHz8/16+7+6+6+5+5+5+4+4
E5-26672.9GHz6/12+6+5+4+3+3+3
E5-26652.4GHz8/16+7+7+6+6+5+5+4+4
E5-26602.2GHz8/16+8+8+7+7+6+6+5+5
E5-26502GHz8/16+8+8+7+5+5+4+4+4
E5-2650L1.8GHz8/16+5+5+4+4+3+3+2+2
E5-26433.3GHz4/8+2+2+1+1
E5-26402.5GHz6/12+5+5+4+4+3+3
E5-26373GHz2/4+2+2
E5-26302.3GHz6/12+5+5+4+4+3+3
E5-2630L2GHz6/12+5+5+4+4+3+3
E5-26202GHz6/12+5+5+4+4+3+3
E5-26092.4GHz4/8
E5-26031.8GHz4/8
E5-16603.3GHz6/12+6+6+4+4+3+3
E5-16503.2GHz6/12+6+6+5+4+3+3
E5-16203.6GHz4/8+2+2+1+1

 Xeon E5 2600のOEMメーカーへの出荷はすでに始まっており、まもなく顧客に向けて搭載製品の出荷が開始される予定だ。


関連情報
(笠原 一輝)
2012/3/7 02:05