ニュース

Arm、DC向けCPU IPデザイン「Neoverse」の高性能版「Neoverse V1」とArmv9に対応した「Neoverse N2」を発表
新しいインターコネクト「CMN-700」に対応し最大256コアを実現可能に

笠原一輝

2021年4月27日 22:00

　ソフトバンク・グループの傘下で、すでに半導体メーカー「NVIDIA」に売却されることが発表されている英Arm（アーム）は、4月27日（英国時間、日本時間4月27日22時）に報道発表を行い、同社が開発してきた新しいデータセンター向けCPU IPデザイン（半導体の設計図のこと）となる「Neoverse V1」、「Neoverse N2」の2製品を発表した。

　ArmのNeoverseは、2018年10月に行われたArmの年次カンファレンス「TechCon 2018」で発表された、同社としては初となるデータセンター専用のCPU IPデザイン。徐々に採用が進んでおり、AWS（Amazon Web Services）のEC2インスタンスで提供されているGraviton 2など、パブリッククラウドでの採用例が増えている。

　Graviton 2に採用されているのは「Neoverse N1」と呼ばれるIPデザインだが、今回はその後継でArmv9に対応したNeoverse N2が投入され、さらにより高性能な製品に特化したNeoverse V1の投入も明らかにされた。

Armが発表したNeoverse V1とNeoverse N2。Neoverse N1と比較してV1が1.5倍、N2が1.4倍の性能を発揮する

AWS EC2インスタンスで利用率が上がりつつあるGraviton 2など、採用例が増加しているDC向けArm CPU

　Armのデータセンター向けCPU IPデザインは、以前は同社の「Cortex」（コーテックス）と呼ばれるモバイル機器（スマートフォンやタブレット）向けのCPU IPデザインをサーバーに転用するという形で行われていた。その時代には、データセンターのメインストリーム市場を狙うというよりは、高密度のブレードサーバーなど、よりニッチな市場を狙うという形になっており、あまり採用が進んでいなかった。

　その状況が大きく変わったのは、2018年のArmの年次カンファレンス「TechCon 2018」で、Neoverse（ネオバース）と呼ばれるデータセンター向け専用のCPU IPデザインを発表してからだ。そのNeoverseの最初の製品として2019年に投入されたのが「Neoverse N1」で、CPU内部のインターコネクト技術となる「CMN-600」と共に投入された。

Armが公開しているNeoverseのロードマップ、今回発表されたのはV1とN2で、2022年以降には「Poseidon」のコードネームで知られる次世代製品が計画されている

　その結果は2020年ごろに徐々に明らかになってきており、特にArmにとって大きな前進となったのは、Amazon Web ServicesのAWS EC2インスタンスに、Amazonが自社で設計してファウンダリーで製造したArm CPUのGraviton 2に、Neoverse N1が採用されたことだ。

　Armによれば、2020年のEC2インスタンスにおける新規追加のうち、実に49％がGraviton 2になっており、x86プロセッサ（AMD、Intel）の51％に近づいている。シェア全体としては、2021年1月時点で15％に増えつつあると説明している。Graviton 2に関しては、NVIDIAのGPUを利用してAI学習を行えるインスタンスを追加する計画であることもすでに発表されている。

AmazonのAWS EC2インスタンスでのGraviton 2のシェア

ソフトウェアの環境も整いつつある

NVIDIA、Armベースのデータセンター向けCPU「Grace」投入を表明
現在のx86ベースのCPUと比較して10倍の性能を発揮
https://cloud.watch.impress.co.jp/docs/news/1318150.html

　このほかにも、OracleのOracle Cloudでは半導体ベンチャーのAmpereから提供されている、Neoverse N1を搭載したAmpere Altraが採用されているほか、中国のTencentでもNeoverse N1を採用したCPUが稼働している。また、中国のAlibabaもArmを採用している。

中国のTencentが採用している

Oracle Clouddでは、Ampere Altraが採用された

中国のAlibabaもArmを採用

ハイパフォーマンス向けのV1、ネットワークなどに向けたN2、よりCPUコアを増やしたSoCを設計できるCMN-700を発表

　そうした一定の成功を収めたNeoverseシリーズの新製品として投入されたのが、Neoverse V1とNeoverse N2の2つの製品となる。ArmではNeoverseを3つの製品セグメントに分けており、ハイパフォーマンス向けのVシリーズ、ネットワーク機器などを意識したスケールアウトなNシリーズ、そしてエッジサーバー向けのEシリーズという3つのシリーズを提供している。

　最初の世代のNeoverseではN1、E1というネットワーク向け、エッジ向けの2製品が登場したが、今回の発表では、まだ投入されていなかったVシリーズの最初の世代としてV1が、そしてNシリーズの第2世代としてN2が登場した形になる。

Neoverse N1の延長線上にあるNeoverse N2と、よりハイパフォーマンスにふったNeoverse V1

　Vシリーズの最初の製品となるNeoverse V1（開発コードネーム：Zeus、ゼウス）は、Armv8（v8.4）の命令セットアーキテクチャに対応しており、N1に比べて約50％パフォーマンスが向上している。TSMCの7nm/5nmで製造可能な設計がすでに用意されており、メモリはDDR5ないしはHBMに対応し、I/O周りもPCI Express Gen 5とCICX 1.1に対応している。命令セットとしては256ビットのSVE2（Scalable Vector Extensions 2、x86プロセッサでのAVXに相当すると理解すればおおむね正しい）に対応しており、SVE2に対応したアプリケーションを活用するとより多くの命令を並列実行できるようになっている。また、Bflot16にも対応している。

　また内部のマイクロアーキテクチャも、Armによれば「Arm史上最高により多くの命令を並列実行できるアーキテクチャ」となっており、8ワイドのフェッチ、5-8ワイドのデコード/リネーム、15ワイドの実行ユニット（4xALU、2xBR、3xロード、2xストア、2xSVE、4xNEON）という構成。N1などに比べて50％性能が向上し、ベクトル演算では1.8倍、マシンラーニングでは4倍の性能を発揮するという。

Neoverse V1のマイクロアーキテクチャ

256ビットのSVE2に対応

ベクトル演算で1.8倍、浮動小数点演算で2倍、マシンラーニングで4倍を実現

　Nシリーズの第2世代製品となるNeoverse N2（開発コードネーム：Perseus、ペルセウス）は、Armが先月発表したばかりの新しい命令セットアーキテクチャ「Armv9」に対応した最初の製品となる。V1と同じようにSVE2に対応しているが、こちらは128ビットまでの対応となる。また、Bflot16にも対応している。メモリはDDR5ないしはHBM3に対応しており、PCI Express Gen 5、CCIX 2.0、CXL 2.0に対応しており、TSMCの5nmへの対応を標準でサポートしている。

　Armによれば、N2はN1に比べて同じ消費電力のレベルであれば約40％性能が向上しており、NGINXを利用した比較でN1に比べて1.3倍、DPDKパケットプロセッシングでN1に比べて1.2倍の性能になっているという。

Neoverse N2

SVE2に対応

N1に比べて1.4倍の性能を発揮

　また、ArmはNeoverse N1と同時に発表したSoC内部のインターコネクト（CPUやメモリコントローラ、I/Oを接続する内部構造のこと）のCMN-600の後継製品として、CMN-700を同時に発表した。

　CMN-700はサポートできる最大コア数などが増えており、CMN-600が最大64コアだったのに対して、CMN-700は最大256コアまでサポートすることができる。そのほかにもキャッシュサイズが最大512MB（従来は128MB）、I/OとしてCCIX 2.0、CXL 2.0に対応するなど強化されている。Neoverse V1やNeoverse N2とCMN-700を組み合わせて利用することで、1ダイあたりのCPUコアやキャッシュなどを増やしたデザインを採用することが可能になる。

CMN-700

プレシリコンでのシミュレーションでは第3世代Xeon SPや第3世代EPYCを上回る性能を発揮するとArmは主張

　Armはプレシリコン（実際の半導体に落とし込む前のシミュレーション段階）レベルで測定したNeoverse V1、Neoverse N2の想定される性能を公開した。Armにより測定されたシングルスレッド時の整数演算性能（SPEC CPU 2017）と、ソケットあたりのマルチスレッド時の整数演算性能（SPEC CPU 2017）がそれで、比較対象としてはTraditional 2021 （40C/80T）、Traditional 2020 （24C/48T）、Traditional 2021 （64C/128T）、Traditional 2020 （64C/128T）という4つが示されており、プレゼンテーションの注によれば、それぞれ以下の通りだ。

Traditional 2021 （40C/80T）：Intel 第3世代Xeon SP（SKU名は書かれていない）
Traditional 2020 （24C/48T）：Intel 第2世代 Xeon SP（8268）
Traditional 2021 （64C/128T）：AMD 第3世代EPYC（7763）
Traditional 2020 （64C/128T）：AMD 第2世代EPYC（7742）

　シングスレッド時の性能では、すでにNeoverse N1でもIntelの第3世代Xeon SPを上回っており、そこからNeoverse V1とNeoverse N2はさらに上回っているとArmは主張している。

　また、ソケット全体マルチスレッド時の性能では、64コアのNeoverse N1はx86プロセッサを下回っていたが、96コアになるNeoverse V1や128コアのNeoverse N2はそれらを大きく上回っているとArmでは主張している。

Neoverseとx86の性能比較、縦軸がシングルスレッドの性能で、横軸がソケットあたりのマルチスレッドの性能。64コアのTraditional 2021/2020はAMD EPYC、40コアと24コアのTraditional 2021/2020はIntel Xeon SP

シングルスレッド

ソケットあたりのマルチスレッド

　むろん、こうしたデータは現時点の競合製品との比較になる。ArmではNeoverse V1やNeoverse N2を搭載した製品サンプルの登場時期を今年中と説明しており、実際に搭載した製品が市場に出回るのは2022年になる可能性が高い。

　その意味では、Intelが2022年に投入するSapphire Rapids（サファイアラピッズ）、AMDが2022年に投入するGenoa（ジェノア）との性能差がどうなるのかが注目されるところだ。

Arm、DC向けCPU IPデザイン「Neoverse」の高性能版「Neoverse V1」とArmv9に対応した「Neoverse N2」を発表新しいインターコネクト「CMN-700」に対応し最大256コアを実現可能に

AWS EC2インスタンスで利用率が上がりつつあるGraviton 2など、採用例が増加しているDC向けArm CPU

ハイパフォーマンス向けのV1、ネットワークなどに向けたN2、よりCPUコアを増やしたSoCを設計できるCMN-700を発表

プレシリコンでのシミュレーションでは第3世代Xeon SPや第3世代EPYCを上回る性能を発揮するとArmは主張

Arm、DC向けCPU IPデザイン「Neoverse」の高性能版「Neoverse V1」とArmv9に対応した「Neoverse N2」を発表
新しいインターコネクト「CMN-700」に対応し最大256コアを実現可能に