ニュース

シュナイダーエレクトリックが解説、GTC 26で見るデータセンターファシリティの最新技術トレンドと今後の潮流

 AIの急速な進展と次世代GPUの登場により、データセンターのファシリティは新たな「物理的限界」に直面している。シュナイダーエレクトリック(以下、シュナイダー)では、ギガワット規模のAI向けデータセンターの設計・構築などについて、検証済みリファレンスデザインをNVIDIAと共同で開発し、Webサイトで公開している。

 NVIDIAが主催するGTC(GPU Technology Conference)は、AI・半導体分野の最新技術や、将来ビジョンを発表する世界最大級の技術カンファレンスだが、昨今はデータセンター向けの色合いが強くなっているとのこと。シュナイダーではメディア向け説明会を開催し、今年3月に開催されたGTC 26で触れられたデータセンター分野の内容について、同社C&SPセグメントアカウントマネージャーの須田拓真氏が紹介した。

シュナイダーエレクトリック C&SPセグメントアカウントマネージャーの須田拓真氏

高性能GPUが動作するファシリティが求められる

 NVIDIAは、「AI Factory」というキーワードを推進している。データセンターはこれまで、顧客のニーズや要求仕様に合わせてファシリティを設計していた。金融業界向けに堅牢なティア4データセンターを構築するなどがその一例だ。

 しかし、AIが市場を牽引している現在、AIサーバー、つまりは高性能のGPUが安定稼働するかどうかによって、データセンターの設計が決まる。「ファシリティの設計を、顧客ではなくベンダーが主導するようになっている。これは、今までと大きく違う」と須田氏は言う。

 AI Factoryのポイントは3つある。


    1.ラック高密度化
    2.冷却方式
    3.デジタライゼーション

 高密度化では、1ラック当たりの発熱量が1MWを超える時代が間もなく来るとNVIDIAでは見ている。これに伴い、配電の直流化や高電圧化についての開発が進むという。

 高集積化によって発熱量が増えると、空冷では冷却しきれないため水冷が前提になる。現在はダイレクトチップ方式が主流だが、電力効率や脱炭素の観点からチップへの供給水温度は高温化へ向かっている。

 また、ファシリティの設計や効率化のために、デジタルツインによるシミュレーションが求められているという。

ラック高密度化による電源設計の変化

 GPUはグラフィック処理向けのチップで、元々はゲーミングPCなどで使われていたものだ。2022年にNVIDIAがデータセンター向けGPUの開発を強く押し出したことで、AIデータセンターのコンポーネントとして注目されるようになった。この時の「A100」はラック当たり25kWという発熱量で、これは従来型のファシリティでなんとか受け入れ可能なレベルだった。

 それが2025年に発表された「Blackwell」シリーズではラック当たり150kW、2026年発表の「Rubin」ではラック当たり200kWにまで高発熱化する。これは空冷では冷やしきれず、水冷が必須となる値だ。

 さらに、NVIDIAが進めている開発では、1年後には400kW/ラック、2年後には1MW/ラックになる見通しだという。こうなると、冷却以前に電源の確保が難しくなる。

 例えば、ラック当たり150kWのシステムの場合、ラックには電源ケーブルを8本引き込む必要がある。電源は通常、データホールに交流で入ってくるため、ラック内にAC/DC変換ユニットを設置する必要もある。

 それが1MWになると、さらに太い電線が32本必要で、これは物理的に無理がある。また、ラック内に32個のAC/DC変換ユニットを入れるスペースはないだろう。これが、ファシリティの物理的限界だ。

電力供給の物理限界

 「どれだけNVIDIAのチップが高性能化しても、電力のファシリティがついていかないと実装できないという世界が来ている」(須田氏)

 これを解決するソリューションと考えられているのが、サイドカーという方式だ。ITラックの隣に電源関連の専用ラックを並べて、ファシリティからの電源供給と変圧、AC/DC変換はそちらで行う。ITラック以外に電源関連のラックがスペースを取ることになるが、集積度の低いITラックを並べるより、高集積のITラック+サイドカーの方がスペース効率はよいという見立てだ。

サイドカーによる電源供給

 サイドカーは、HPCやスパコンの世界で既に実装されている例がある。ただし、1MWのシステムのために32本の電線を通すのはいずれにしろ無理なので、NVIDIAでは800Vの高電圧の直流で給電することを求めている。既存のITシステム向けの400Vの直流と、これから出てくる最新GPUのための800Vの直流を、サイドカーから供給するというのが、次世代ラックシステムだという。

 将来的に、ラック当たり1MWが当たり前になったなら、そもそもデータセンターのファシリティの電源を直流にすると、AC/DC変換による電力ロスが減るため効率がよい。データセンターの入り口で系統電源からの交流を直流に変換し、800Vの高電圧でデータセンター内に配線するという考え方だ。また、太陽光発電など、元々直流で受電できる電力もある。

電源設計の推移

 ただし、このアイデアにはハードルがある。800V電源の工事は、専門の資格を持っていなければできない。これは安全のために定められている法律なので、簡単に変更していいとは考えられない。ただし、データセンターの直流給電が電力ロスを減らし使用効率を上げるのは間違いないので、研究は進められている。

 「GTC 26では、まだプロトタイプのモデルではあるが、直流の800Vのサイドカーのイメージ実機はけっこう展示されていた」(須田氏)

冷却水の高温度化が進む

 いくら高性能のチップでも温度が上がりすぎると正常動作しないので、電源と合わせて冷却も非常に重要なキーワードになっている。

 チップの消費電力と推奨表面温度の関係は、以下の図の通りだ。

アシュレーによるTCS温度に関する推奨事項

 700W以下なら、コールドプレートの温度は45℃程度で運用可能だ。これは、コンプレッサーなどを使わなくても、フリークーリングで十分冷やせる温度帯である。ただし、将来出てくる1000Wや1500Wのチップであれば、もう少し低い温度帯でコールドプレートを冷やす必要がある。30℃の冷却水が必要なら、季節によってはコンプレッサーを稼働させる必要があるだろう。

 冷却用の水温が高いほど、冷却に使うエネルギーは少なくてすむ。問題は、既存の空調用チラーは、30℃以上の温水を送水できないという点だ。このため、液冷サーバーを導入するなら、高温水を送水できる別のチラーが必要になる。

 現時点では、データセンター内のすべてが水冷ではなく、空冷と水冷が混在しているケースも多い。また、多くの場合はサーバー以外のネットワーク機器などは空冷だ。ただし、その割合が分からないと、どのような熱源をどのような割合で用意すべきか分からない。このため、柔軟に対応できるように、過剰な設備を持つ必要がある。さらには、将来のチップの要求温度が分からないため、熱源設計しにくい。

 このような設計課題を解決するために、シュナイダーでは送水温度帯の広いチラーを開発した。フリークーリングとコンプレッサーを組み合わせ、最高32℃までの温水を送水できる。同じチラーで、水冷サーバー用の30℃の一次冷却水も作れるし、空調用の20℃の冷水も作れる。今年までは空調用に使っていたが、来年からは液冷用に切り替えるといった使い方が可能になるため、高温用と低温用で重複してチラーを用意する必要がなくなるわけだ。

送水温度帯の広いチラーで二熱源システムを構築

 「GTCでは、冷却用の水温の議論の中でも、システム全体を根本的に見直す必要があると再確認できた」(須田氏)

デジタル化により設計段階でシミュレーション

 データセンターの設計・構築の際に、電力や冷却について事前にシミュレーションしたいという声が顧客から届いているという。設計図面のデジタル化は既に進んでいるが、シュナイダーでは、ETAPやAVEVAというソフトウェア製品でデジタルツインを作成し、設計に誤りがないか事前に分析したり、実運用のデータを取り込んで効率化のための分析をするなどの対応を進めている。

 以上のような、AIサーバーのための高密度化、冷却、デジタライゼーションについて、シュナイダーではリファレンスデザインを公開している。NVIDIAとの緊密な連携があり、チップの高性能化に合わせて半年程度の頻度でアップデートされている。配管系統図などかなり具体的に、細かい内容の資料も含まれているので、興味があればシュナイダーのサイトから入手してみてほしい。