特集

最大96コアとなったAMDの第4世代EPYC、I/O周りやメモリなども大幅に強化

スーCEOは“競合の3倍の性能”をアピール

 AMDは11月10日(現地時間、日本時間11月11日未明)に米国カリフォルニア州サンフランシスコ市内のホテルで開催した発表会において、同社がGenoa(ジェノア)の開発コード名で開発した「第4世代EPYCプロセッサ(以下、第4世代EPYC)」を発表した。

第4世代EPYC、中央のIOD(I/O ダイ)のほかに、CCD(CPUコアを内蔵しているダイ)が12個あることがわかる。左に置いた100円玉と比較すると、結構大きなことがわかる

 第4世代EPYCでAMDは、1つのCPUパッケージあたり96CPUコアを実現し、2ソケットで192コアを実現している。また、PCI Express Gen 5も1ソケットで最大128レーン、2ソケットで160レーンを利用可能になっている。

 こうした強力なスペックを実現できたのも、AMDがこれまでEPYCシリーズで採用して成功を収めてきたチップレット(CPUの基板上に異なるダイを混載する技術)をさらに発展させているからだ。

2017年から3世代を着実に進化してきたEPYC、第4世代ではチップレットの構造を強化

 AMD 会長兼CEO リサ・スー氏は、同社がサンフランシスコで行った発表会で、「AMDは2017年に初代EPYCをリリースしてから、第2世代、第3世代と順調に製品を発表してきて、データセンターのモダン化を実現した。今日はそれをさらに加速する第4世代EPYCを発表する。第4世代EPYCは、最高の性能、最高のエネルギー効率、そして最高のTCOを実現している」と述べ、AMDが2017年にリリースした初代EPYC(開発コード名:Naples)、2019年にリリースした第2世代EPYC(同:Rome)、2021年にリリースした第3世代EPYC(同:Milan)の3世代にわたるEPYCの延長線上に、今回の第4世代EPYCのリリースがあり、引き続き高性能と高い電力効率などを提供すると強調した。

第4世代EPYCを手に持つAMD 会長 兼 CEO リサ・スー氏
表1:EPYC各世代のスペック(作成:筆者)

 AMDのEPYCシリーズの特徴は、AMDがチップレットと呼んでいる、パッケージ上で複数のダイを混載する技術を最初の世代から応用していることだ。初代では8つのCPUコアを内蔵しているダイ(AMDではCCDと呼んでいる)4個分を1つのパッケージに統合しており、1ソケットで最大32CPUコアを実現していた。

 第2世代、第3世代EPYCではそのチップレットをさらに改良し、従来はCCDに入っていたPCI ExpressやメモリコントローラなどのI/O関連のコントローラをIOD(I/O ダイ)という別ダイに分離することで、さらにCCDの数を増やすことに成功。初代EPYCでは4個だったCCDを8個に増加した。これにより、第2世代EPYC、第3世代EPYCでは1つのソケットで最大64コアを実現した。

 同時期の競合他社の製品である第2世代Xeon Scalable Processor(Cascade Lake-SP)では最大28コア、第3世代Xeon Scalable Processor(Ice Lake-SP)では最大40コアであったのに、最大64コアを実現していることがEPYCの大きなセールスポイントになっていた。

EPYCの進化(作成:筆者)

 今回の第4世代EPYCでも、そうしたチップレットを採用することで、引き続き多数のCPUコア数を提供することを可能にしている。具体的には、従来世代では8個までだったCCDの数を最大12個に増やしているのだ。従来と同じようにCCD1つあたりに8CPUコアを内蔵しているので、8コア×12=96コアを1パッケージで実現可能になっている。

 CCDを12個にすることができた背景には、第4世代EPYCから新しいソケットが導入されたことがある。初代から第3世代EPYCまでは、Socket SP3(58.5x75.4mm、4410.9平方mm)というソケットが利用されていた。それに対して今回の第4世代EPYCでは、メモリが一新されてDDR5に変更されたこともあり、新しいソケットとしてSocket SP5(72x75mm、5328平方mm)が導入され、底面積がやや大きくなっている。これにより、CCDをより多く並べて、かつ基板に配線を通すことが可能になったのだ。

 これにより、Intelの現行製品となる第3世代Xeon SPの40コアと比較すると倍以上のCPUコアを、1ソケット実現することが可能になっている。Intelは次世代製品となるSapphire Rapidsの仕様をまだ公開していないが、Sapphire RapidsベースのHBM搭載版となるXeon Maxでは最大56コアであることを明らかにしており、Sapphire Rapidsも同程度のCPUコア数になる可能性が高い。このことを考えると、第4世代の最大96コアというスペックは、コア数の多さがAMD側のアドバンテージとして残る可能性を示唆していると言える。

CPUコアはZen 4に強化、新たにAVX-512に対応しAI推論の性能が強化される

 こうした第4世代EPYCだが、CPUコアそのものもAMDがZen 4(ゼンフォー)と呼んでいる最新のCPUマイクロアーキテクチャへと進化している。AMDによれば、Zen 4ではフロントエンドと呼ばれる分岐予測やデコーダー(x86命令を内部命令に変換するエンジン)、メモリのロード/ストアなどの部分が大きく改善されており、第3世代EPYCで採用されていたZen 3に比較して、IPC(Instruction Per Clock-cycle、1クロックあたりに実行できる命令数、IPCが高ければ高いほどCPUは命令を効率よく実行することが可能になり性能が向上する)が14%向上している。

Zen 4マイクロアーキテクチャに進化したことで14%のIPC向上を実現(出典:AMD)
フロントエンドなどの改良が加えられている(出典:AMD)

 またZen 4では、x86の拡張命令であるAVX-512命令に対応している。IntelとAMDはx86命令に関するクロスライセンス契約を過去に結んでおり、その契約は今も有効で、AMDにはAVX命令のような拡張命令を自社製品に搭載する権利がある。これに基づき、第3世代EPYCまではAVX-256に対応していたが、Intelが初代Xeon Scalable Processor(Skylake)で導入したAVX-512に関しては、これまでサポートされてこなかった。今回それが実装されたことで、EPYCへ移行しないという理由の1つが消えたことになる。

AVX-512に対応(出典:AMD)

 ただしAVX-512の実装は、従来のAVX-256時代と同じ256ビットのレジスタを利用して演算になる。このため、AVX-512命令の実行には2クロックがかかることになるので、スループットそのものはAVX-256時代と大きく変わらない可能性が高い。とはいえ、AVX-512に対応したアプリケーションを走らせることができるので、そのメリットは小さくない。なお、一口にAVX-512といっても、第2世代Xeon SPで追加されたAVX512_VNNI、第3世代Xeon SPで追加されたAVX512_BF16などの追加の拡張命令があるが、そうした拡張命令をひっくるめてAVX-512に対応している。基本的には第3世代Xeon SPと同じレベルの拡張命令をサポートしている。

 このAVX-512に対応することで、性能も引き上げられる。第3世代EPYCと比較して自然言語処理で4.2倍、画像分類で3倍、画像認識で3.5倍となっており、AVX-512の利用が進んでいるAI推論で大きな効果があることがわかる。

AVX-512に対応することでAI推論時の性能が引き上げられる(出典:AMD)
仮想マシン関連の拡張命令にも対応(出典:AMD)

PCI Express Gen 5、DDR5メモリ、CXLに対応などI/O周りが大幅に強化

 I/O周りの強化も第4世代EPYCの大きな強化点になる。I/O周りでの強化点としては、新たにPCI Express Gen 5に対応していることが挙げられる。従来の第3世代EPYCでは、PCI Express Gen 4までの対応となっていたので、この点が最大の強化点となる。1ソケットあたり128レーンというスペックに大きな違いはないが、2ソケットの場合には160レーンをPCI Express Gen 5として利用が可能で、さらに12レーンをPCI Express Gen 4として利用することができる。

第4世代EPYCのハイレベルなスペック(出典:AMD)

 また、すでに説明したとおり、第4世代EPYCではCPUソケットがSocket SP5に強化され、メモリは従来のDDR4からDDR5へと切り替えられている。さらにメモリのチャンネル数も、第3世代EPYCの8チャンネルから12チャンネルへと増加されている。これにより、DDR5-4800を12チャンネル構成で利用した場合には、最大460GB/秒という超広帯域のメモリとして利用可能だ。

 なおメモリチャンネル構成は、12チャンネルだけでなく、10チャンネル、8チャンネル、6チャンネル、4チャンネル、2チャンネルでも利用可能と、柔軟な構成をサポートする点も実利用環境ではうれしいところだ。

CPUソケットはSP5へと進化(出典:AMD)
DDR5メモリの12チャンネルに対応(出典:AMD)

 なお、PCI Express Gen 5のうち最大64レーンは、業界標準のインターコネクトとなるCXL 1.1として利用できる。CXLは、メモリのコヒーレントをとることが可能になる規格で、今回の第4世代EPYCでは、CXL 2.0の機能の1つである、メモリバッファーを介してDDR5メモリを接続可能になっている。これにより、CXL経由で接続されるメモリモジュールを追加のメモリとして利用し、大容量のメモリが必要なアプリケーション(データベースなど)に対応することが可能になる。このCXLは第4世代EPYCだけでなく、Intelが1月に正式発表を予定しているSapphire Rapidsでもサポートされる予定で、SCM(Storage Class Memory)に変わる大容量メモリの手段として活用されていくことになりそうだ。

CXL 1.1に対応(出典:AMD)
Intel Innovation(9月にサンノゼで開催)で展示されたHynixのCXLメモリ(左)、SamsungのCXLメモリ(右)

モデルナンバーを刷新、型番は9000番台に

 第4世代EPYCでは、モデルナンバーに関して新しい仕組みが導入され、型番も従来の7000番台から9000番台へと変更されている。

 千の桁では製品のシリーズを示しており、第4世代EPYCでは9の数字になる。百の桁の数字はコア数を示しており、8コアなら0、16コアなら1、24コアなら2、32コアなら3、48コアなら4、64コアなら5、そして84~96は6となっている。十の桁は性能を示しており、数字が大きければ大きいほど高い性能であることを示している。そして一の桁は世代を示しており、第4世代EPYCでは第4世代なので4となっている。

 数字の後にアルファベットがついていない場合には通常版、Pとついている場合には1ソケット向け、Fとついている場合にはコア数を調整して高周波数を優先しているSKUであることを意味している。

新しいスキームのモデルナンバー(出典:AMD)
表2:第4世代EPYCのSKU(AMDの資料などより筆者作成)

 AMDはこうしたSKUを、コア性能重視の製品(FがついているSKU)、コア密度優先のSKU、バランス重視のSKUの3グループに分けており、顧客がそれぞれの目的に応じて選択することを可能にしている。

SKUは3つのグループに分けられている(出典:AMD)

第4世代EPYC搭載サーバー1台が競合製品搭載サーバー3台相当の性能を発揮、初期投資もTCOも削減される

 なおAMDは、第4世代EPYC(EPYC 9654)、第3世代EPYCの最上位モデル(EPYC 7763)、競合となるIntelの第3世代Xeon SPの最上位モデル(Xeon Platinum 8380)との性能差に関する資料を公開。VMmark 3.1.1で格納できるVM数を比べると、EPYC 9654はXeon Platinum 8380の約3倍になっており、第3世代Xeon SPを搭載したサーバー3台で第4世代EPYC1台に相当するとアピールしている。

第4世代EPYCの性能(出典:AMD)

 AMD 会長 兼 CEO リサ・スー氏は「第3世代Xeon SPであれば15台が必要な処理は、第4世代EPYCであれば5台ですませることができ、初期投資を抑えられる。さらに消費電力も低くなるので、ランニングコストを抑えることが可能で、TCOが削減される」と説明。第4世代EPYCにすることで、サーバーの調達コストもTCOも削減可能になるとアピールした。

IntelのXeon Platinum 8380が15台必要な処理を、第4世代EPYCは5台で済ませることができ、初期導入コストを抑えられるだけでなく、1kWhの電力コストも0.46ドル低く抑えることができるという

Dell、HPE、Lenovo、Supermicroなどが第4世代EPYCに対応したサーバーを発表

 今回発表された第4世代EPYCは即日出荷が開始されており、同時にOEMメーカーからも搭載製品が発表されている。

 DellはDell PowerEdge R7625、R7615、R6625、R6615の4製品を発表した。2Uの2ソケットがR7625、2Uの1ソケットがR7615、1Uの2ソケットがR6625、1Uの1ソケットがR6615になる。

 AMDの発表会にはDell Technologies グローバルインフラソリューション事業本部 コアビジネス運営部長 オーサー・ルイス氏が登壇し、第4世代EPYCを搭載したサーバーが各種の記録的なスコアを出していると説明し、EPYC搭載製品への期待感を語った。

Dell Technologies グローバルインフラソリューション事業本部 コアビジネス運営部長 オーサー・ルイス氏(左)がAMDの発表会に登壇
第4世代EPYCにより高い性能を実現

 HPEは、HPE ProLiant Gen11サーバーを発表。AMDの記者会見にはHPE 社長兼CEO アントニオ・ニール氏がビデオ出演し、AMDへの期待感を語っている。

HPE 社長兼CEO アントニオ・ニール氏

 Lenovoは、21の新しいThinkSystemサーバーとThinkAgileハイパー・コンバージド(HCI)ソリューションを発表している。AMDの発表会にはLenovo 執行役員 インフラストトラクチャソリューション事業部 事業部長のカーク・スコーゲン氏が登壇し、Lenovoが開発中の水冷サーバーのデモなどが行われた。

Lenovo 執行役員 インフラストトラクチャソリューション事業部 事業部長のカーク・スコーゲン氏(左)
EPYCの水冷サーバーを開発中

 Supermicroは、45を超える第4世代EPYC搭載サーバーを発表し、販売開始している。Supermicro 社長兼CEO チャールズ・リアン氏はAMDの発表会に登壇し、第4世代EPYCに期待感を表明し、サステナブルなデータセンターの構築に期待感を表明した。

Supermicro 社長兼CEO チャールズ・リアン氏(左)
45を超えるEPYCサーバーをSupermicroが発表

 このほかにも、Google、Microsoft、OracleなどのハイパースケーラのCSP(クラウドサービスプロバイダ)がビデオ出演ないしは登壇し、第4世代EPYCを搭載したパブリッククラウドサービスの提供開始などに関して説明を行った。

*****

 競合のIntelが次世代製品を出荷することができず足踏みする中で、AMDが先行して新製品を出荷できた意味は小さくない。AMDのスーCEOは、会見後に行われた質疑応答の中で「ここ12~18カ月間、AMDはサーバー向けの製造能力を増強してきた。それでもこの12カ月はややギリギリの供給になっていたが、年末までには改善する見通しで、来年は供給量を潤沢にしていく。特にGenoaではソケットが更新されたこともあり、来年いっぱいぐらいはMilan(第3世代EPYC)と共存していく形になるだろう」と述べ、第4世代EPYCと並行して第3世代EPYCも併売していくことで、供給を増やしてシェアを増やしていきたいという意向を表明した。