仮想化道場

2017年のサーバープロセッサ動向・Intel編

山本雅史

2017年1月31日 06:00

　Intelは2017年の中盤、第6世代Coreプロセッサ（開発コード名：Skylake）と同じアーキテクチャのXeon E5/E7シリーズをリリースする予定だ。最新世代のXeon E5/E7シリーズは、これまでとどう変わってくるのか、あるいは変わらないのか。

　今回は、リリース予定の最新Xeonについて、現時点の情報に基づいてお届けする。

SkylakeベースのXeon E5/E7が登場予定

　新しいXeonについて、製品名は正式には発表されていないが、ここでは仮に主に2～4ソケット向けのXeon E5 v4の後継をXeon E5 v5（開発コード名：Skylake-EP）、主に4～8ソケット向けのXeon E7 v4の後継をXeon E7 v5（開発コード名：Skylake-EX）として話を進めていく。いずれも、Skylakeアーキテクチャを採用した製品となる。

　Xeon E5 v5、Xeon E7 v5のリリーススケジュールは、2016年11月に米国で開催されたSuperComputing 16（SC16）において、2017年中盤と発表された。

　コア数としては、最大32コア／64スレッドになるようだ。動作クロックは前世代のXeon E5 v4と比べると、最大で200～300MHzアップする。だたし、高クロックのXeonはコア数やキャッシュメモリが少ない。コア数が最も多い32コア製品は2GHzほどになるようだ。

　Xeon E5 v4では最大コア数が22コアだったが、Xeon E5 v5では10コア以上アップすることになる。製造プロセス自体は、Xeon E5 v4とXeon E5 v5では同じ14nmが採用されているため、コアの最適化を行ったとしても、10コアも増えるとは思えない。もしかすると、Xeon E5 v4では歩留まりの関係でオフになっていたコアが、14nmの製造プロセスがこなれてきたことで、オンになるのかもしれない。

　命令セットに関しても、AVX512のサポート、浮動小数点演算と暗号アルゴリズムの高速化などが行われている。

Skylake-EP/EXは、AVX512、浮動小数点演算と暗号アルゴリズムの高速化などが行われている。さらに、Xeon Phiで採用された高速ネットワークのOmni-Pathがサポートされる（出典：米Intelのイベント、Supercomputing16の資料より）

　また、Xeon E5 v5ではソケットが変更される予定だ。Xeon E5 v4では、LGA2011が使われていたが、Xeon E5 v5ではLGA3467となり、ピン数が大幅に増えているようだ。

　ピン数が増えている原因としては、Xeon E5とXeon E7でこれまでは異なっていたソケットデザインを統合し、2ソケット向け、4ソケット向け、8ソケット向けの各製品を共通化させることにある。

　Intelとしては、2/4/8ソケットで使用するチップセットなどを共通化することで、サーバーベンダーが複数のサーバー製品を開発しやすいようにする狙いがあるようだ。もちろんIntel側としても、現在は分かれているXeon E5/E7などの2系列のチップセット（プラットフォーム）の開発リソースを統合することで、開発部門のスリム化も果たせる。

　また8ソケットのサーバーは一般的ではなく、ミッションクリティカル用途に特化しているため、チップセットを含めてコストが高い。さらに、8ソケット以上のサーバーに関しては、一部のサーバーベンダーが自社開発のチップセットを使って構成していることから、出荷台数としては非常に少数だ。

　こうしてXeon E5 v5とXeon E7 v5は、ピン数、ピン配置、信号線を含めて物理的な違いがなくなってくる。もしかすると今後は、E5/E7といったブランド名はなくなるのかもしれない。

　従来、Xeon E7のシリーズには、ミッションクリティカル用途を見据えて、システムの信頼性やセキュリティを向上させる機能が搭載されていた。Intelでは、Xeon E7のこうした機能をXeon E5に取り込んできたが、Xeon E5 v5では、Xeon E7のミッションクリティカル機能をさらにいくつか取り込んでいるという。

　こうしたことからも、Xeon E5/E7で異なる部分は、プロセッサがサポートする最大プロセッサ数（ソケット数）だけ、という方向になっていきそうだ。

　なお、2017年にリリースが予定されているXeon Phi（開発コード名：Knights Mill）も、同じソケットとなる予定。

Intelとしては、ディープラーニングなどのアクセラレータとしてXeon PhiやFPGAをコ・プロセッサとして利用することを提唱している（出典：International Supercomputing Conference 2016の資料より）

Xeon Phiは、単独でOSを動かすように変わった。また、コアもAtomベースにすることでパフォーマンスが大幅にアップしている（同左）

Xeon Phiは、ディープラーニングだけでなく、金融、ライフサイエンス、ビジュアライゼーションなどでパフォーマンスをアップする（同左）

次世代Xeon Phi（Knights Mill）は、2017年後半にリリース。よりAI用途にチューニングしたプロセッサになる（出典：Intel Supercomputing 16の資料より）

2016年6月にリリースされた第2世代のXeonPhi、X200ファミリー（IntelのWebサイトより）

第2世代のXeonPhiを搭載したハーフサイズのComputeユニット（同左）

メモリやインターコネクトの変更点

　Xeon E5 v5は、メモリとしてはDDR4 2666をサポートする。さらに、チャンネル数としては6本となる（Xeon E5 v4では4チャンネル）。1チャンネルあたり2本のDIMMがサポートされる。

　プロセッサ間の接続に使用するのは、Xeon E5 v4のQPIから、新しいUPIというインターコネクトに変更される。UPIは、最大10.4MT/秒（QPIは9.6GT/秒）とバススピードが高速化されている。1プロセッサからUPIが最大3本用意されることで、8ソケットサーバーに対応する。

　Xeon E3などの1ソケットサーバーに対しては、LGA3467では規模が大きくなりすぎるため、ピン数を少なくしたLGA2061が使用されるようだ。ちなみに、LGA2061は、ハイエンドデスクトップ向けのCoreプロセッサでも使用される。メモリは、DDR4が4チャンネル（1チャンネルあたり2本のDIMM）。

3D XPointメモリでサーバー全体を高速化

　Skylake世代のXeonでは、IntelとMicron Technologyが共同で開発した新しい不揮発メモリ「3D XPoint」がサポートされるだろう。

　3D XPointは当初、既存のNAND型フラッシュメモリの1000倍の性能を持つと大々的にアナウンスされていたが、第1世代はそれほどのパフォーマンスは出ないだろう。また、ローコストで大容量メモリが提供できるとしたことも、第1世代では実現できそうにない。

　Intelが提供する「Optane」は、SSDやHDDとメモリに入るキャッシュとして利用することになりそうだ。インターフェイスはPCIe Gen 3 x4（製品によってx2も）が使用されている。当初言われていた、メモリスロットに挿すNVRAMは第1世代では実現しそうにない。

　用途としては、IntelのOptaneはコンシューマ市場に注力し、Micronが提供する「QuantX」はエンタープライズ市場に注力するとされている。QuantXは、PCIe x4/x8などの拡張カード形態の高速ストレージとして提供されるようだ。

　なおクライアントPCについては、第7世代Coreプロセッサ（開発コード名：Kabylake）からのサポートとなる。

Kabylakeは、Intelが開発している新しい不揮発性メモリのOptane（3D Xpoint）に対応している（出典：CESで開催された、IntelのKabylake発表会資料より）

Xeonのバリエーション

　Intelでは、2015年に買収したFPGA大手のAlteraを買収しているが、Xeonのバリエーションとして、AlteraのFPGA（Arria 10 GX）とXeon（Broadwell世代）をMCP（Multi Chip Package）で1プロセッサにした製品を、サンプル出荷している。

　当初は、2016年には製品化するとしていたが、2017年1月現在、正式リリースにはなっていない。現在は、14nmで製造されたFPGAのStratix 10を使ったMCPを検討しているのかもしれない。

　また、FPGAのプログラミングツールの整備など数多くの課題があるため、当面の間は大規模なクラウド事業者などに向けて、受注生産のような形で提供される可能性が高いのではないか。

2016年3月に開催されたOpen Compute Projectのコンファレンスでは、Arria 10 GXとXeon（Broadwell世代）を1ソケットにしたプロセッサを発表。サンプルとしてFacebookなどの事業者各社に提供されている（出典：OCP2016コンファレンスのストリーミングビデオより）

Arria 10 GXとXeon（Broadwell）が入ったプロセッサ（同左）

OCPで発表されたFPGAよりも1つ世代を進めたのがStratix 10。もしかすると、プロダクトとしてはStratix 10を搭載したXeonになるのかもしれない（同上）

今後のXeonは？

　CESでは、2017年に省電力ノートPC向けにリリースされたKabylakeプロセッサのデスクトップ向けがリリースされた。あわせて、10nmで製造される次世代の省電力プロセッサCannonlake（開発コード名）を搭載した、リファレンスのノートPCのデモを行っている。

　Cannonlakeは、2017年中のリリースが表明されているが、Kabylakeを10nmのプロセスで製造しただけになり、アーキテクチャはほとんど変わらない。また、10nmの製造プロセスに関してはいろいろと問題をはらんでいるため、うまく量産化ができるか疑問だ。

　実際、Cannonlakeは省電力のノートPC向けとしてリリースされ、デスクトップやパフォーマンスノートPC向けには、2018年に14nmで製造するCoffeelake（開発コード名）が登場するとうわさされている。

　従来、サーバー向けはコンシューマ向けから1世代～2世代遅れてリリースされてきたが、新たな10nm製造プロセスの開発などが必要になるため、サーバー向けのプロセッサがCannonlakeに移行するのは、これまでよりも時間がかかる可能性がある。

　前述したような10nm製造プロセスの問題があるとすれば、Cannonlakeはサーバープロセッサとしてはスキップされ、今回取り上げたSkylake世代のXeonの次世代としては、2018年にKabylakeベースのXeonが、2019年にはCoffeelakeベースのXeonがそれぞれ登場することになるだろう。

　ただ、Skylake世代のXeonでソケットなどが大幅に変更されることもあり、KabylakeやCoffeelake世代はそのままのソケットが使用できることになると思われる。

　なお、新しいマイクロアーキテクチャや製造プロセスの開発に関しては、PCを中心においた体制から、データセンターなどに向けた体制へとかじが切られている。PC用とサーバー用で、マイクロアーキクチャが別のものになるとは思えないが、サーバー向けのプロセッサから機能を削減したコアをPCで使うようになるかもしれない。

　ただしプロセッサの世代が変わっても、パフォーマンスは大きく向上しなくなっている。今回コンシューマ向けにリリースされたKabylakeコアは、1つ前のSkylakeと、コア数やパフォーマンス面ではほとんど変わらない。大きく進化しているのは、内蔵GPU部分だ。

2017年1月にリリースされた第7世代Coreプロセッサ（Kabylake）は、コアのパフォーマンスアップよりも、GPUの性能アップが目立っている（出典：CESで開催された、IntelのKabylake発表会資料より）

第7世代Coreプロセッサは、4Kビデオや3Dゲームを高い性能で表示できる（同左）

　こうしたことから当面の間、サーバー向けプロセッサにおいても、コア自体の大幅なパフォーマンスアップは見込めない。コア数に関しても、製造プロセスの移行期間が長くなっているため、一気に増えないだろう。

　また、Windows Server 2016やSQL Server、Oracle Databaseのようにコアライセンスを採用しているソフトウェアが増えており、物理コア数が増えればライセンス料がアップするということになる。

　したがって、ハードウェアのコストだけでなく、OSやデータベースなどを含めたシステム全体のコストを計算する必要がある。以前のように、新世代のプロセッサを導入することで大幅なパフォーマンスアップが図れるという時代は終わり、今後は、プロセッサよりもNVRAMやSSDなどの高速ストレージにコストをかける時代になるのかもしれない。