ニュース
AI向けGPUサーバーで急成長のSupermicro、「ビルディングブロックソリューション」で最先端サーバーに対応
2024年12月12日 06:15
サーバー製品を開発・販売する米Super Micro Computer(以下、Supermicro)は10日、事業内容や製品についてプレス向けに説明する記者会見を開催した。
Supermicroは、NVIDIAのリファレンスサーバーを開発製造するなど、特徴的なサーバー製品を作っている企業だ。近年では、GPUサーバーにより、AIブームによって売り上げや株価が上昇している。
会見では、GPUサーバーや水冷ソリューションなど先端的な製品を中心に、Supermicroの佐野晶氏(ゼネラルマネージャー、FAE&ビジネスデベロップメント)が解説した。
ビルディングブロックソリューションで最新テクノロジーに対応
まずはSupermicroの紹介だ。1993年にシリコンバレーのサンノゼで台湾出身のCharles Liang氏(CEO)によって創業された。現在従業員数6500名強で、半数が研究開発エンジニアだという。
FY2024(2024年度)の売り上げは149億ドル(約2.2兆円)。FY2023が71億ドル(約1.0兆円)だったのに対して急激に売上高が伸びていると佐野氏は説明し、FY2025には260億~300億ドル(約3.9~4.5兆円)を目指していると語った。
日本市場についても、佐野氏はIDC社のレポートを引用し、売上高で1位にあると説明し、「いままで弊社はどちらかというと他のベンダーに追いつけ追い越せとやってきたが、AIブームに乗って売り上げを増やした」と語った。出荷台数においても、通信やクラウド向けの一般的なサーバーやブレードサーバーが台数を稼いでおり、1位にあるという。
SupermicroがAI向けGPUサーバーなど最先端に追従して製品を開発して成長する根幹として、佐野氏は同社の「ビルディングブロックソリューション」を挙げた。マザーボード、I/O、シャーシ、電源、サーマルソリューション、ファームウェア、管理ソフトなど各部分を自社で開発し、それを社内でインテグレーションしてサーバーに仕立てることを指す。「GPUなどの半導体の開発スパンは短い一方で、シャーシやケーブルなどはスパンが長い。それらを自社で組み合わせることで、新しいGPUサーバーも組み合わせで作れる」(佐野氏)。
ラックソリューションで水冷GPUサーバーに対応
また近年に力を入れているものとして、ラックソリューションも佐野氏は紹介した。サーバーやネットワーク機器、ストレージなどをまるごとサーバーラックに組んで出荷するものだ。
特に水冷(液冷)ソリューションではラックソリューションが必須になると佐野氏は説明する。さらに水冷については、データセンターのクーリングタワー(冷却塔)もSupermicroで用意していると語った。
GPUサーバーでいうと、最新のNVIDIA DGX B200(Blackwellアーキテクチャ)を8基搭載するGPUサーバーが、空冷だと冷却設備のために10Uのサイズになるのに対し、水冷だと4Uのサイズに収まるという。
こうした水冷のGPUサーバーのフラグシップとなるのが、Supermicroが製造開発するNVIDIA GB200 NVL72だ。1ラックに72個のBlackwell GPUと36個のGrace CPUを搭載し、72個のGPUがNVLinkで密結合する。
こうした水冷システムには、ヒートシンクのかわりにチップを冷やすコールドプレートや、ラックに冷却液を引き込んで冷却するCDU(Cooling Distribution Unit)、各サーバーに冷却水を供給するCDM(Cooing Distribution Manifold)、管理ソフトなどが必要になる。これらのものについても、自社開発するビルディングブロックソリューションによってテクノロジーの進化に追いついている、と佐野氏は説明した。
xAIや東大・筑波大などGPUスーパーコンピューターの事例
続いて、SupermicroのGPUサーバーの先端事例も佐野氏は紹介した。
1つめの事例は、Elon Musk氏のAI企業「xAI」のAIスーパーコンピューターである「xAI Colossus」だ。4Uに8つのH100 GPUを搭載する水冷サーバーを1ラックに8台搭載し、合計で5万個のGPUが400Gbps Ethernetで密結合接続するという、世界最大のAIスーパーコンピューターだ。
2つめの事例は、東大と筑波大による共同HPC基盤「Miyabi(OFP-2)」だ。NVIDIA GH200(Grace Hopper)が1120ノード、InfiniBand NDR 400Gbpsで接続した、GPUスーパーコンピューターだ。Top500では富岳に続いて国内アカデミックで2位にあり、世界的にもGH200ソリューションとして上位にあるという。水冷対応していないネットワーク機器やストレージは、ラックのリアドアに設置した水冷による冷却設備によって空冷しているとのことだ。
グリーンコンピューティングの事例としては、IntelがCPUを開発するデータセンターにもSupermicroのサーバーが50万台以上使われていると佐野氏は紹介した。空冷ながら、フリーエアクーリングでPUE1.06を実現しているという。
また、Preferred Networks(PFN)との共同開発のシステムでは、PFNのAIチップであるNM-3をSupermicroのサーバーに組み込み、GREEN 500の1位を3回受賞したという。
最後に佐野氏は、Supermicroではこれらの大型システムだけでなく、エッジデバイスやストレージなどの小さなシステムなども手がけていることや、研究所などで使われる最新のテクノロジーを取り入れたシステムとしても多く採用されていると紹介。最新のハードウェアテクノロジーを使い、最適化してソリューションにすることを、ビルディングブロックソリューションをベースに実現していると語った。