特別企画

Intelがサーバー向けdGPU「Intel Server GPU」発表、4基搭載のPCIeアドオンカードを提供開始

oneAPIは12月にゴールド版を提供、NVIDIAのCUDAコードの読み込みやNVIDIA GPUでの演算も可能に

笠原一輝

2020年11月12日 11:49

　米Intelは11月11日（現地時間）に報道発表を行い、同社がSG1（エスジーワン）の開発コード名で開発を続けてきたXe-LPベースのサーバー向けdGPU「Intel Server GPU」を発表したことを明らかにした。

　Intel Server GPUは、先日IntelのdGPU（外付けGPU）としては22年ぶりに投入された「Intel Iris Xe MAX（開発コード名：DG1）」と同じく、Xe-LPのアーキテクチャを採用しており、96EU（実行ユニット）に128ビット幅のメモリコントローラを備え、8GBのLPDDR4メモリがビデオメモリとしてオフチップに搭載される。

Intel Server GPU（SG1）

　またIntelは、そのIntel Server GPUを4つ搭載した、PCI Express Gen3対応のアドオンカードとして「H3C XG310」を同時に発表。Xe-LPが持つ高いメディアエンコード性能や高い電力効率のEUなどを活用して、ゲームや動画など、ストリーム配信向けメディアエンコードサーバーなどの市場向けに投入する。

Intelが発表したIntel Server GPU（SG1）を4つ搭載したアドオンカード「H3C XG310」

　なおIntelは、そうしたdGPUや、CPU、FPGAなどの複数のプロセッサ（IntelではxPUと呼んでいる）を利用するためのソフトウェア開発環境として、oneAPI（ワンエーピアイ）の提供計画をすでに示してきたが、12月にはゴールドバージョン（日本語で言えば製品相当版）の提供を開始すると明らかにした。

　Intelによれば、既存商用開発ツールのParallel Studio XE、Intel System StudioなどもoneAPIに統合されて提供される。このoneAPIでは、NVIDIAのCUDA向けのコードをoneAPIに読み込ませることが可能なほか、NVIDIAのGPUなど、他社の半導体も最適化の対象にしていることなども明らかにされた。

SG1のコード名で開発されてきたIntel Server GPUが発表、アドオンカードH3C XG310に4つ搭載

　Intelが今回発表したサーバー向けのdGPU、Intel Server GPUは、開発コード名「SG1」で開発されてきた製品がベースだ。Xe-LPと呼ばれるGPUアーキテクチャを採用しており、低消費電力で電力効率の高いGPUとなっている。

　このXe-LPは、Intelのクライアント向けのSoCとなる第11世代Coreプロセッサ（開発コード名：Tiger Lake）のiGPU（内蔵GPU、Iris Xe）に採用されているほか、先日発表されたノートPC向けのdGPUとなる「Iris Xe MAX」にも採用されており、今回発表されたIntel Server GPUはそれらに次ぐ製品となる。

第11世代CoreのiGPU（Iris Xe）、dGPUとなるIris Xe MAXに次ぐ3つめのXe-LPアーキテクチャ採用製品

　Intel Server GPUは96EU（実行ユニット）を備え、128ビット幅のメモリコントローラ、8GBのLPDDR4をビデオメモリとして採用、といったスペックになっており、基本的なスペックは、第11世代Coreに内蔵されているIris Xe、dGPUのIris Xe MAXと共通だ。製造プロセスルールは、10nm FinFETというIntelの最新の10nmプロセスルールで製造される。

Intel Server GPU（SG1）のスペック

　今回Intelでは、Intel Server GPUを搭載したアドオンカードとして「H3C XG310」を発表した。このH2C XG310は、1枚のカードにIntel Server GPUを4基搭載しており、1台のサーバーに最大4枚のカードを実装できるようにしている。

　H2C XG310を利用すると、Xe-LPの特徴である2パイプのメディアエンコード機能や、GPUとしての演算性能を利用して、メディアエンコードなどをサーバー側で高速に行うことができる。

H3C XG310

H3C XG310には4つのIntel Server GPUが搭載される

H3C XG310の基盤裏面

　その具体的なアプリケーションとしてはTensentやUbitusが提供しているクラウドゲーミングの事例がある。クラウドゲーミングとは、サーバー側でゲームのレンダリング処理を行い、それをストリームの形でユーザーのスマートフォンなどに配信する形だが、ゲームでは応答性が重要になるので、レイテンシ（遅延）をできるだけ抑えて、1台のサーバーで多くのユーザーに配信できるようにする必要がある。

　H2C XG310では1枚のアドオンカードに4基のIntel Server GPUを内蔵しているため、それぞれのGPUに内蔵されているメディアエンコーダーなどを利用して、より多くのユーザーを格納することが可能になる。

　例えば、Tensentが提供しているAndroid向けクラウドゲームのサーバーにH2C XG310が採用されており、2枚のH3C XG310により100ユーザーを1サーバーでカバーできるようになっているという。またUbitus社のクラウドゲーミングサーバーでも、1つのサーバーに2枚のH2C XG310が採用され、従来使っていたソリューションと比較すると2倍の性能上昇が認められたとのことだ。

Tensent GamesやUbitusの提供するクラウドゲーミングのサーバーに採用

NVIDIAのCUDAのコードも読み込めるoneAPI、最適化の対象にはNVIDIA GPUやAMD CPUも

　今回発表されたIntel Server GPUは、どちらかと言えばコストパフォーマンスや電力あたりの性能などを重視した製品で、NVIDIAやAMDなどが提供しているHPC向けのGPUなど、ピーク性能を重視したGPUに対抗するような製品ではない。

　しかしIntelは、こうしたサーバー向けのGPUは長期的に、かつ段階的に導入する計画を立てている。今回のIntel Server GPUに使われているXe-LPはローエンド向けであり、今後HPC向けのXe-HPC、サーバー向けのXe-HPそして、ゲーミング向けのXe-HPGという3つの追加アーキテクチャが今後リリースされる計画だ。

　Intelによれば、Xe-HPCは開発段階で、Xe-HPはサンプル出荷の段階、そしてXe-HPGは半導体の最初のサンプルが完成し、電源が入った状態だと説明した。

XeアーキテクチャのGPU開発状況

　そしてIntelでは、今回発表したIntel Server GPUを含め、そうしたXe-HPG/Xe-HPなどのサーバー向けGPUをより効率よく利用するためのソフトウェア開発環境を、すでにベータ版として提供開始している。それが、「oneAPI」だ。

　oneAPIは、CPU、GPU、そしてFPGAなどのIntelがxPUと呼ぶ複数のプロセッサをより効率よく利用するためのソフトウェア開発環境で、NVIDIAが提供しているCUDAのように中間言語/ライブラリとなるoneAPIがxPUを抽象化して、複数種類、複数世代のxPUをより効率よく使うための仕組みとなる。

oneAPIの仕組み

　AI、IoT、レンダリング、HPC向けなど、ドメインスペシフィック（特定用途向け）なアドオンツールキットも提供されており、目的のドメインに合わせたアドオンツールキットを利用することで、xPUを利用するソフトウェアを作成できるようになる。

ドメインスペシフィックな開発ツールキットも提供

　Intelによれば、CUDAのコードを読み込んでoneAPIに取り込む機能が用意されるほか、NVIDIAのGPUも、xPUの1つとしてサポートする計画。これにより、すでにXeon＋NVIDIA GPUという環境を持っているユーザーがCUDAからoneAPIに移行することもできるし、そこにIntelのGPUを追加するということも可能になる。

CUDAコードをoneAPIに読み込み、IntelのxPUやNVIDIA GPUへの最適化が可能に

　また、現在Intelが提供しているIntel Parallel Studio XE（ソフトウェアの並列化を実現する商用開発ツール）、Intel System Studio（性能最適化/電力最適化を実現する商用開発ツール）はoneAPIに統合される計画で、商用サポートプログラムも提供される。

　なお、Intelがソフトウェア開発者向けにXeonやFPGAをクラウドベースで提供しているDevCloudには、今回発表されたIris Xe MAXや、Xe-HPのサンプル版などが追加される計画で、oneAPIで作成したソフトウェアをクラウドベースで試すことが可能になる。

Intel Parallel Studio XEやIntel System StudioもoneAPIに取り込まれる

DevCloudにIris Xe MAXやXe-HPが追加される

oneAPIのゴールド版は12月に出荷開始、Xe-HPCやXe-HPを採用した高性能なサーバー向けGPUも登場予定

　なお今回、Intelは、このoneAPIの製品版に相当するゴールドバージョンを12月から提供開始することを明らかにした。現在のサーバー向けGPUで何よりも重要視されているのはソフトウェア開発環境で、より具体的に言うならNVIDIAのCUDAだ。多くのプログラマーがCUDAに慣れ親しんでおり、そのコードをそのまま読み込ませることができること、そしてNVIDIAのGPUもxPUのターゲットにできることは、大きな意味があるといえる。

　CUDAは（実質的に）NVIDIAのGPUだけをターゲットに最適化が行われるが、oneAPIではそれに加えてXeon、Intel GPU、FPGA、そしてNVIDIA GPUなども含めて最適化ができるようになる、これがメリットと言えるだろう。

　そうしたoneAPIの普及が進めば、Intel GPUもより本格的に性能面でのメリットが出てくる。来年にはXe-HPC、Xe-HPを採用した本格的にNVIDIAのサーバー向けGPU（A100やTesla V100など）に対抗できる製品が投入される計画になっており、その時こそ本格的にデータセンターなどでIntel GPUの採用が進むことになるだろう。今回発表されたIntel Server GPUはその第一歩にすぎないのだ。

oneAPIのゴールドバージョンが12月にリリースされる