特別企画

1ソケットで2ソケット分の性能・環境を実現――、AMDのサーバー向けプロセッサ「EPYC」の最新動向を見る

 AMDのx86サーバー向けプロセッサ「EPYC」(エピック)が、発表から1年を迎えた。

 この間に、Dell、HP、LenovoといったグローバルのトップOEMメーカーから製品が販売開始され、すでにデータセンターなどに、実際に導入が開始されている。

 そうしたAMDのEPYCの現状について、日本およびアジアパシフィック地域でマーケティングを担当している、日本AMD株式会社 データセンター・エンベデッド・ソリューション営業本部 アジアパシフィック・日本地区担当 本部長 林田裕氏に話を聞いたので、その時の模様を基に、この1年のEPYCの動きや今後についての展望をまとめていきたい。

AMDが昨年発表、出荷を開始したEPYC

【お詫びと訂正】

  • 初出時、林田氏のお名前を誤って記載しておりました。お詫びして訂正いたします。

かつてはx86サーバープロセッサ市場で25%の市場シェアを持っていたAMDだが…EPYCで大反攻作戦を実行中

 AMDのx86サーバー向けプロセッサの「EPYC」が発表されてから1年が経った。この1年を振り返って、日本AMDの林田氏は「かつて、AMDはサーバー市場で25%の市場シェアを持っていた。この1年では、将来的にそうした時代と同じような成功を実現するために、さまざまな手を打ってきた」と振り返る。

日本AMD株式会社 データセンター・エンベデッド・ソリューション営業本部 アジアパシフィック・日本地区担当 本部長 林田裕氏

 林田氏の言う通り、かつてAMDはx86プロセッサ市場では唯一の競合相手となるIntel社と互角に競争し、市場の1/4のシェアを獲得していた時代がある。

 具体的には、2000年代の半ばから後半にかけてが該当する。2003年にリリースしたOpteronが、Intelに先立ってx64(AMD64/Intel64)と総称されるx86の64ビット命令に対応し、かつメモリコントローラをIntelに先駆けて統合するなどしており、性能も同時期のIntelプロセッサと比較して高性能かつ低消費電力という特徴を備えていたため、Intelのサーバープロセッサのオルタナティブ(別の選択肢)として市場で評価され、採用が進んだのだ。

 だが、それも、2000年台後半にIntelがメモリコントローラを搭載したNehalemマイクロアーキテクチャの製品などを投入して追いかけると、徐々に局面が変わってきた。

 Intelが確実に性能を上げてきたのに対し、AMDは性能よりも省電力の方に重きを置いたBulldozerマイクロアーキテクチャのOpteronを投入したものの、性能的にはあまり高くなく、徐々に市場シェアを失う形になってしまったのだ。

 その後、AMDはArmアーキテクチャのサーバー用マイクロプロセッサに方針を転換しかけたが、そもそもArmアーキテクチャのサーバー市場自体が立ち上がらなかったなどの問題があり、またサーバー向けx86プロセッサの新製品が投入されないこともあって、x86サーバー市場での市場シェアが限りなくゼロに近づく、という状況になってしまっていた。

 そうした状況を覆すべく、AMDが満を持して投入した製品が、2017年6月に発表されたEPYCになる。AMDにとって、EPYCは大反攻作戦の仕上げともなる製品だ。

 EPYCは、AMDが新たに開発したZenマイクロアーキテクチャと呼ばれるCPUに基づいて設計されている。Zenは、Bulldozerの反省を生かし完全にゼロから設計された新しいCPUだ。命令キャッシュを増やしたり、SMT(Simultaneous Multithreading)に対応したり、といった特徴を備えており、IPC(Instruction Per Clock-cycle)が従来世代に比べて大幅に引き上げられている。

 Zenはまず、デスクトップPC向けの製品であるRyzenに採用され、その後HEDT向けのRyzen Threadripper、モバイル向けのRyzen Mobileなどに採用された。特にデスクトップPC向け市場では高い評価を受けており、Intelがカウンターとしてコア数を増やしたCPUを投入する必要に追い込まれるなどの成果を出している。

 そうしたZenを利用して、サーバー向けのCPUソケットに対応させた製品がEPYCだ。開発コードネーム「Naples」で知られる最初のEPYCは、Socket SP3の名前で知られる4096ピンのCPUソケット向けCPUとして、2017年6月に発表され、順次OEM/ODMメーカーのサーバー製品に搭載・出荷されて、現在に至っている。

EPYCの1ソケットは、IntelのXeon SPの2ソケットに相当する性能や機能を実現できる

 EPYCの特徴は、その実現方法にある。EPYCでは、CPUのサブ基板上に4つのダイが搭載され、そこにヒートスプレッダーをかぶせるという独特の形で提供されている。一般的なCPUでは、CPUのダイが1つで、その上にヒートスプレッダーをかぶせる形になっているのに対し、やや特殊な形になっている。

EPYCは1つのサブ基板上に4つのダイが搭載される形となっている

 この方式の優れているところは、デスクトップPC向けのRyzenとダイを共有できることだ。このため製造の効率が良く、結果、低コストで製品を提供可能になる。

 もう1つの特徴は、それぞれのCPUダイに、最大8コアのCPU、PCI Expressやメモリコントローラが実装されており、CPUパッケージ全体で、使えるPCI Expressのレーン数やメモリコントローラの数を増やせる点だ。

 具体的に言うと、1つのCPUダイでは、8コア、32レーンのPCI Express、2チャネルのメモリコントローラを実現できており、ダイが4つあるため、EPYCは1つのCPUソケットで、最大32コアのCPUコア、最大128レーンのPCI Express、最大8チャネルのメモリコントローラ、最大2TBのメインメモリというスペックを実現できている。

EPYCの特徴

 これにより、林田氏が「もちろんOEMメーカーがどんな実装をするかによるが、PCI Expressのレーンに余裕があれば、NVMeのSSDを接続するのにも余裕を持たせられる。またサーバーとサーバーの接続に利用する場合でも、帯域に余裕を持たせることができる」と話すように、サーバー製品としての仕上がりにも影響してくる。

 サーバーの性能は、単にCPUのコア数だけで実現されるわけではない。そうした周辺部分にも余裕を持たせることができるのが、EPYCの大きな特徴だ。

 実際、こうしたスペックをIntel側で実現するには、2ソケットのXeon スケーラブルプロセッサ(SP)が必要になる。2ソケット分のプラットフォームを1ソケット分で実現できれば、その分マザーボードを小さくしてコストを抑えたり、サーバーの密度(デンシティ)を上げたりすることが可能になる。

1ソケットのEPYC 7551Pと2ソケットのIntel Xeon Gold 5118の比較(出典:AMD)
EPYCのラインアップ(出典:AMD)

1ソケットで2ソケット分の性能や機能を実現していることはTCOの削減につながっている

 そうした1ソケットで2ソケット分というAMDのアピールは、性能だけにとどまらない。林田氏は「2ソケット分を1ソケットにすることができれば、TCOには大きな影響がある。というのも、VMwareにせよ、データベースソフトウェアにせよ、エンタープライズのソフトウェアの課金単位はソケット数に依存することが多く、2ソケットの性能や機能を1ソケットで実現できることには、(コスト面で)大きなメリットがある」と説明する。

 林田氏の言う通り、エンタープライズのソフトウェアはソケット数に応じて課金されるものが多く存在するので、ソフトウェアのコストを含めたTCOを削減することが可能になる。

 こうした点は、OEMメーカーにも評価されており、Intelの2ソケットサーバーのリプレース候補として、1ソケットサーバーをリリースするサーバーメーカーは少なくないという。

 実際、日本で発売されている製品でもDellのPowerEdge R6415/PowerEdge R7415などが1ソケットのサーバーとなっている(編集注:HPEからも7月19日にHPE ProLiant DL325 Gen10が発表された)。もちろん2ソケットの製品もあり、HPE ProLiant DL385 Gen10は2ソケットの製品となっている。

 このほかにも、Lenovo、CRAY、CISCOといったグローバルに展開するサーバーメーカー、SuperMicroやTyan、GIGA-BYTE TechnologyといったODMベンダもEPYC搭載製品をリリースしている。

すでに多くのODMメーカー、OEMメーカーを獲得(出典:AMD)

 林田氏によれば、国内での採用例も増え始めている。「ヤフー株式会社ではハイパーバイザー・アプリケーションにシングルソケットのサーバーシステムを導入していただいている。従来の環境に比べてTCOの削減につながるというところを評価していただいている」とのこと。

 Yahoo! Japanのブランドで知られるヤフーでは、ハイパーバイザーを利用した仮想マシン環境のインフラとして、Dellの1ソケットサーバーとなるPowerEdge R7415を導入したことを、両社連名のプレスリリースで発表している。

 その理由についてヤフー側では「TCOの削減」としており、前述のような、1ソケットで2ソケットの性能や機能を実現していることを評価したのだ、と考えることができるだろう。

ヤフー株式会社への導入事例(出典:AMD)

 これに対して、もう1つの奈良先端科学技術大学の事例では、AI・マシンラーニング(機械学習)の演算用にHPE ProLiant DL385 Gen10が利用されているという。

 「こちらの場合は、純粋に性能が評価されている。先方では競合のプラットフォームから交換したところ、演算性能に余裕ができたという評価もいただいている」(林田氏)との通りで、2ソケット時では、競合との性能差が重要視されているとのことだった。

奈良先端科学技術大学への導入事例(出典:AMD)

来年には7nmプロセスルールに微細化したEPYCを投入、COMPUTEX TAIPEIでサンプルを公開

 こうして見てくると、かなり良いように見えるEPYCだが、解決すべき課題もないわけではない。

 1つは、仮想マシン(VM)をIntelプラットフォームからAMDプラットフォームへと移行する時に、ライブマイグレーションと呼ばれる、VMを動かした状態のまま移行させることが難しいという点だ。これは、仮想マシンが利用している命令セット(IntelならVT、AMDならAMD-Vなど)に互換性がないため。一度VMを終了し、命令セット関連の変換をしてから移行するという、コールドマイグレーションが必要になる。

 この点に関して林田氏は「VMを移行するとなると、ライブマイグレーションでは難しいという課題はある。しかし、動かし続けなければいけないシステムでなければ、一度止めてコールドマイグレーションをしてもらえば問題はない。また、サーバーの入れ替えではなくて、サーバーの増強の時などにうまく活用してもらったりすれば、十分対応可能だと考えている。結局、そこはTCOと、サーバーを止めて作業をすることとのトレードオフだ」と述べる。

 既存のサーバーの置き換えには課題があるのは事実だが、サーバーの増強時にAMDに入れ替えれば問題は発生しないし、仮にサーバーを止めてコールドマイグレーションする場合でも、TCOの削減という目に見える効果があるのでカバーできるというのがAMDの主張ということだ。

7nmで製造されるEPYCを2018年中にサンプル出荷(出典:AMD)

 そして最後に林田氏は「お客さまにとって重要なことは、この世代だけで終わりになるのではなく、将来世代にわたって製品が提供されるという保証だ。このため、われわれは積極的にロードマップについて説明している。6月に行われたCOMPUTEX TAIPEIでは7nmのプロセスルールで製造されるEPYCのサンプルを公開し、現在当社のラボで評価中で、2019年には製品を投入する」と説明する。

 筆者も参加したCOMPUTEX TAIPEIのAMDの記者会見では、7nmという最先端のプロセスルールで製造されるEPYCのサンプルを、AMD 社長兼CEOのリサ・スー氏自らが公開した。

COMPUTEX TAIPEIで7nmで製造される次世代EPYCのサンプルを公開するAMDのリサ・スー 社長兼CEO

 AMDにとって、このことの意味は小さくない。

 というのも、Intelが次世代のサーバープロセッサとして公開を計画しているCascade Lakeは、Intelの14nm++と呼ばれる14nmの改良版の改良版プロセスルールで製造される予定だからだ。

 Intelにおいて10nmの立ち上げがうまくいっていないのは、すでに業界では誰もが知っている事実になりつつあり、AMDなどが利用するファウンダリーが、Intelの10nmに相当する7nmプロセスルールの立ち上げで先行する可能性は高い、と考えられている。

 つまり、これまでサーバー向けCPUの製造では常にIntelから1世代遅れのプロセスルールにとどまってきたAMDが、Intelより進んだ製造プロセスルールを使ってサーバーのCPUを製造する事態が、初めて発生するということだ。

Radeon Open Ecosystemと7nmのRadeon Instinctでディープラーニングで先行するNVIDIAに追いつく

 それだけでなく、AMDはもう1つの注目分野である、ディープラーニング(深層学習)/マシンラーニング(機械学習)向けのソリューションの拡充も行っている。

 この分野では、CUDAとそれをディープラーニングのフレームワーク(TensorFlowやCaffeなど)に組み合わせるソフトウェアを組み合わせて提供することで、GPUによる演算を一般化させたNVIDIAのリードが続いているが、GPUでは市場をNVIDIAと二分しているAMDも、ソリューションの拡充を図っている。

Radeon Open Ecosystem(ROCm)の提供を開始(出典:AMD)
Radeon Instinct MI25(出典:AMD)

 AMDは、Radeon Open Ecosystem(ROCm)というオープンなソフトウェア開発環境を提供し、TensorFlowやCaffeなどへの最適化を容易にする仕組みをすでに提供開始している。すでに、このROCmを公式にサポートするGPUとして、Radeon Instinct MI25という(同社の開発コードネーム“Vega”で知られる)GPUの提供を開始しているが、2018年後半には、次世代EPYCと同じく7nmのプロセスルールで製造されるVegaを利用したRadeon Instinctが投入されることを明らかにしている。

 すでにAMDは、この7nmのRadeon InstinctのライブデモをCOMPUTEX TAIPEIで行っており、こちらが投入されれば、現在ディープラーニング/マシンラーニングの市場で独走を続けるNVIDIAにとって、強力なライバル登場となる可能性がある。

今年後半に7nmで製造されるVegaをベースにしたRadeon Instinctを投入(出典:AMD)
COMPUTEX TAIPEIで公開された7nmのRadeon Instinctのライブデモ

 「お客さまに言われるのは、『一強という状況は良くない、きちんと対抗馬が必要だ』、ということ」(林田氏)との言葉の通り、ユーザーにとっては、市場で正しく競争原理が働くような選択をしていくことは重要だ。

 しかし、性能的に段違いだったりとした場合は、多少コストがかさんでも一強を選択しておいた方が、トータルではTCOが下がる。今まではそういう状況だったと言ってよい。

 これに対して、x86サーバープロセッサとしてのEPYC、そしてディープラーニング向けのRadeon Instinct、ともに性能やTCOでIntelやNVIDIAに追いつき、今後の製品では追い越していく可能性すら秘めている。

 「ユーザーにとっては、そうした可能性を検討する時期に来ていると言える」――、として、この記事のまとめとしたい。