特集
最大96コアとなったAMDの第4世代EPYC、I/O周りやメモリなども大幅に強化
スーCEOは“競合の3倍の性能”をアピール
2022年11月15日 06:15
AMDは11月10日(現地時間、日本時間11月11日未明)に米国カリフォルニア州サンフランシスコ市内のホテルで開催した発表会において、同社がGenoa(ジェノア)の開発コード名で開発した「第4世代EPYCプロセッサ(以下、第4世代EPYC)」を発表した。
第4世代EPYCでAMDは、1つのCPUパッケージあたり96CPUコアを実現し、2ソケットで192コアを実現している。また、PCI Express Gen 5も1ソケットで最大128レーン、2ソケットで160レーンを利用可能になっている。
こうした強力なスペックを実現できたのも、AMDがこれまでEPYCシリーズで採用して成功を収めてきたチップレット(CPUの基板上に異なるダイを混載する技術)をさらに発展させているからだ。
2017年から3世代を着実に進化してきたEPYC、第4世代ではチップレットの構造を強化
AMD 会長兼CEO リサ・スー氏は、同社がサンフランシスコで行った発表会で、「AMDは2017年に初代EPYCをリリースしてから、第2世代、第3世代と順調に製品を発表してきて、データセンターのモダン化を実現した。今日はそれをさらに加速する第4世代EPYCを発表する。第4世代EPYCは、最高の性能、最高のエネルギー効率、そして最高のTCOを実現している」と述べ、AMDが2017年にリリースした初代EPYC(開発コード名:Naples)、2019年にリリースした第2世代EPYC(同:Rome)、2021年にリリースした第3世代EPYC(同:Milan)の3世代にわたるEPYCの延長線上に、今回の第4世代EPYCのリリースがあり、引き続き高性能と高い電力効率などを提供すると強調した。
AMDのEPYCシリーズの特徴は、AMDがチップレットと呼んでいる、パッケージ上で複数のダイを混載する技術を最初の世代から応用していることだ。初代では8つのCPUコアを内蔵しているダイ(AMDではCCDと呼んでいる)4個分を1つのパッケージに統合しており、1ソケットで最大32CPUコアを実現していた。
【初代EPYC】
AMD、サーバー向け新アーキテクチャCPU「EPYC」を発表
【第2世代EPYC】
AMDがサーバー向けCPU市場に帰ってきた――、内部アーキテクチャを更新した「第2世代EPYC」の特徴を解説
【第3世代EPYC】
AMD、“Milan”ことZen 3コアに進化した第3世代EPYCを発表 キャッシュ階層の改良でIPCを向上、6chメモリもサポート
第2世代、第3世代EPYCではそのチップレットをさらに改良し、従来はCCDに入っていたPCI ExpressやメモリコントローラなどのI/O関連のコントローラをIOD(I/O ダイ)という別ダイに分離することで、さらにCCDの数を増やすことに成功。初代EPYCでは4個だったCCDを8個に増加した。これにより、第2世代EPYC、第3世代EPYCでは1つのソケットで最大64コアを実現した。
同時期の競合他社の製品である第2世代Xeon Scalable Processor(Cascade Lake-SP)では最大28コア、第3世代Xeon Scalable Processor(Ice Lake-SP)では最大40コアであったのに、最大64コアを実現していることがEPYCの大きなセールスポイントになっていた。
今回の第4世代EPYCでも、そうしたチップレットを採用することで、引き続き多数のCPUコア数を提供することを可能にしている。具体的には、従来世代では8個までだったCCDの数を最大12個に増やしているのだ。従来と同じようにCCD1つあたりに8CPUコアを内蔵しているので、8コア×12=96コアを1パッケージで実現可能になっている。
CCDを12個にすることができた背景には、第4世代EPYCから新しいソケットが導入されたことがある。初代から第3世代EPYCまでは、Socket SP3(58.5x75.4mm、4410.9平方mm)というソケットが利用されていた。それに対して今回の第4世代EPYCでは、メモリが一新されてDDR5に変更されたこともあり、新しいソケットとしてSocket SP5(72x75mm、5328平方mm)が導入され、底面積がやや大きくなっている。これにより、CCDをより多く並べて、かつ基板に配線を通すことが可能になったのだ。
これにより、Intelの現行製品となる第3世代Xeon SPの40コアと比較すると倍以上のCPUコアを、1ソケット実現することが可能になっている。Intelは次世代製品となるSapphire Rapidsの仕様をまだ公開していないが、Sapphire RapidsベースのHBM搭載版となるXeon Maxでは最大56コアであることを明らかにしており、Sapphire Rapidsも同程度のCPUコア数になる可能性が高い。このことを考えると、第4世代の最大96コアというスペックは、コア数の多さがAMD側のアドバンテージとして残る可能性を示唆していると言える。
CPUコアはZen 4に強化、新たにAVX-512に対応しAI推論の性能が強化される
こうした第4世代EPYCだが、CPUコアそのものもAMDがZen 4(ゼンフォー)と呼んでいる最新のCPUマイクロアーキテクチャへと進化している。AMDによれば、Zen 4ではフロントエンドと呼ばれる分岐予測やデコーダー(x86命令を内部命令に変換するエンジン)、メモリのロード/ストアなどの部分が大きく改善されており、第3世代EPYCで採用されていたZen 3に比較して、IPC(Instruction Per Clock-cycle、1クロックあたりに実行できる命令数、IPCが高ければ高いほどCPUは命令を効率よく実行することが可能になり性能が向上する)が14%向上している。
またZen 4では、x86の拡張命令であるAVX-512命令に対応している。IntelとAMDはx86命令に関するクロスライセンス契約を過去に結んでおり、その契約は今も有効で、AMDにはAVX命令のような拡張命令を自社製品に搭載する権利がある。これに基づき、第3世代EPYCまではAVX-256に対応していたが、Intelが初代Xeon Scalable Processor(Skylake)で導入したAVX-512に関しては、これまでサポートされてこなかった。今回それが実装されたことで、EPYCへ移行しないという理由の1つが消えたことになる。
ただしAVX-512の実装は、従来のAVX-256時代と同じ256ビットのレジスタを利用して演算になる。このため、AVX-512命令の実行には2クロックがかかることになるので、スループットそのものはAVX-256時代と大きく変わらない可能性が高い。とはいえ、AVX-512に対応したアプリケーションを走らせることができるので、そのメリットは小さくない。なお、一口にAVX-512といっても、第2世代Xeon SPで追加されたAVX512_VNNI、第3世代Xeon SPで追加されたAVX512_BF16などの追加の拡張命令があるが、そうした拡張命令をひっくるめてAVX-512に対応している。基本的には第3世代Xeon SPと同じレベルの拡張命令をサポートしている。
このAVX-512に対応することで、性能も引き上げられる。第3世代EPYCと比較して自然言語処理で4.2倍、画像分類で3倍、画像認識で3.5倍となっており、AVX-512の利用が進んでいるAI推論で大きな効果があることがわかる。
PCI Express Gen 5、DDR5メモリ、CXLに対応などI/O周りが大幅に強化
I/O周りの強化も第4世代EPYCの大きな強化点になる。I/O周りでの強化点としては、新たにPCI Express Gen 5に対応していることが挙げられる。従来の第3世代EPYCでは、PCI Express Gen 4までの対応となっていたので、この点が最大の強化点となる。1ソケットあたり128レーンというスペックに大きな違いはないが、2ソケットの場合には160レーンをPCI Express Gen 5として利用が可能で、さらに12レーンをPCI Express Gen 4として利用することができる。
また、すでに説明したとおり、第4世代EPYCではCPUソケットがSocket SP5に強化され、メモリは従来のDDR4からDDR5へと切り替えられている。さらにメモリのチャンネル数も、第3世代EPYCの8チャンネルから12チャンネルへと増加されている。これにより、DDR5-4800を12チャンネル構成で利用した場合には、最大460GB/秒という超広帯域のメモリとして利用可能だ。
なおメモリチャンネル構成は、12チャンネルだけでなく、10チャンネル、8チャンネル、6チャンネル、4チャンネル、2チャンネルでも利用可能と、柔軟な構成をサポートする点も実利用環境ではうれしいところだ。
なお、PCI Express Gen 5のうち最大64レーンは、業界標準のインターコネクトとなるCXL 1.1として利用できる。CXLは、メモリのコヒーレントをとることが可能になる規格で、今回の第4世代EPYCでは、CXL 2.0の機能の1つである、メモリバッファーを介してDDR5メモリを接続可能になっている。これにより、CXL経由で接続されるメモリモジュールを追加のメモリとして利用し、大容量のメモリが必要なアプリケーション(データベースなど)に対応することが可能になる。このCXLは第4世代EPYCだけでなく、Intelが1月に正式発表を予定しているSapphire Rapidsでもサポートされる予定で、SCM(Storage Class Memory)に変わる大容量メモリの手段として活用されていくことになりそうだ。
モデルナンバーを刷新、型番は9000番台に
第4世代EPYCでは、モデルナンバーに関して新しい仕組みが導入され、型番も従来の7000番台から9000番台へと変更されている。
千の桁では製品のシリーズを示しており、第4世代EPYCでは9の数字になる。百の桁の数字はコア数を示しており、8コアなら0、16コアなら1、24コアなら2、32コアなら3、48コアなら4、64コアなら5、そして84~96は6となっている。十の桁は性能を示しており、数字が大きければ大きいほど高い性能であることを示している。そして一の桁は世代を示しており、第4世代EPYCでは第4世代なので4となっている。
数字の後にアルファベットがついていない場合には通常版、Pとついている場合には1ソケット向け、Fとついている場合にはコア数を調整して高周波数を優先しているSKUであることを意味している。
AMDはこうしたSKUを、コア性能重視の製品(FがついているSKU)、コア密度優先のSKU、バランス重視のSKUの3グループに分けており、顧客がそれぞれの目的に応じて選択することを可能にしている。
第4世代EPYC搭載サーバー1台が競合製品搭載サーバー3台相当の性能を発揮、初期投資もTCOも削減される
なおAMDは、第4世代EPYC(EPYC 9654)、第3世代EPYCの最上位モデル(EPYC 7763)、競合となるIntelの第3世代Xeon SPの最上位モデル(Xeon Platinum 8380)との性能差に関する資料を公開。VMmark 3.1.1で格納できるVM数を比べると、EPYC 9654はXeon Platinum 8380の約3倍になっており、第3世代Xeon SPを搭載したサーバー3台で第4世代EPYC1台に相当するとアピールしている。
AMD 会長 兼 CEO リサ・スー氏は「第3世代Xeon SPであれば15台が必要な処理は、第4世代EPYCであれば5台ですませることができ、初期投資を抑えられる。さらに消費電力も低くなるので、ランニングコストを抑えることが可能で、TCOが削減される」と説明。第4世代EPYCにすることで、サーバーの調達コストもTCOも削減可能になるとアピールした。
Dell、HPE、Lenovo、Supermicroなどが第4世代EPYCに対応したサーバーを発表
今回発表された第4世代EPYCは即日出荷が開始されており、同時にOEMメーカーからも搭載製品が発表されている。
DellはDell PowerEdge R7625、R7615、R6625、R6615の4製品を発表した。2Uの2ソケットがR7625、2Uの1ソケットがR7615、1Uの2ソケットがR6625、1Uの1ソケットがR6615になる。
AMDの発表会にはDell Technologies グローバルインフラソリューション事業本部 コアビジネス運営部長 オーサー・ルイス氏が登壇し、第4世代EPYCを搭載したサーバーが各種の記録的なスコアを出していると説明し、EPYC搭載製品への期待感を語った。
HPEは、HPE ProLiant Gen11サーバーを発表。AMDの記者会見にはHPE 社長兼CEO アントニオ・ニール氏がビデオ出演し、AMDへの期待感を語っている。
Lenovoは、21の新しいThinkSystemサーバーとThinkAgileハイパー・コンバージド(HCI)ソリューションを発表している。AMDの発表会にはLenovo 執行役員 インフラストトラクチャソリューション事業部 事業部長のカーク・スコーゲン氏が登壇し、Lenovoが開発中の水冷サーバーのデモなどが行われた。
Supermicroは、45を超える第4世代EPYC搭載サーバーを発表し、販売開始している。Supermicro 社長兼CEO チャールズ・リアン氏はAMDの発表会に登壇し、第4世代EPYCに期待感を表明し、サステナブルなデータセンターの構築に期待感を表明した。
このほかにも、Google、Microsoft、OracleなどのハイパースケーラのCSP(クラウドサービスプロバイダ)がビデオ出演ないしは登壇し、第4世代EPYCを搭載したパブリッククラウドサービスの提供開始などに関して説明を行った。
*****
競合のIntelが次世代製品を出荷することができず足踏みする中で、AMDが先行して新製品を出荷できた意味は小さくない。AMDのスーCEOは、会見後に行われた質疑応答の中で「ここ12~18カ月間、AMDはサーバー向けの製造能力を増強してきた。それでもこの12カ月はややギリギリの供給になっていたが、年末までには改善する見通しで、来年は供給量を潤沢にしていく。特にGenoaではソケットが更新されたこともあり、来年いっぱいぐらいはMilan(第3世代EPYC)と共存していく形になるだろう」と述べ、第4世代EPYCと並行して第3世代EPYCも併売していくことで、供給を増やしてシェアを増やしていきたいという意向を表明した。