ニュース
SC25で見たHPC/AIサーバーの技術トレンドとシステムの新潮流、電源・冷却の課題
2025年12月17日 06:00
米国ミズーリ州セントルイスにて、11月16日からSC25(Supercomputing 2025)が開催された。SCは、ハイパフォーマンスコンピューティングおよびAI技術の分野における世界最高峰の国際展示会で、世界中からデータセンター事業者、AI開発企業、先端研究機関が一堂に会する。シュナイダーエレクトリックは12月8日、SC25に参加した識者を招いたパネルディスカッションを開催した。
登壇者は、国立研究開発法人理化学研究所計算科学研究センターの三浦信一氏、アット東京 技術サービス本部設備構築部長の錦織雅夫氏、そしてシュナイダーエレクトリック C&SPセグメントアカウントマネージャーの須田拓真氏の3名だ。
SC25から読み解くAI・HPCの最新トレンド
東京工業大学のTSUBAMEや理化学研究所の富岳のプロジェクトに携わってきた三浦氏は、SCに20年以上参加している。今年の印象としては、「スーパーコンピューティングの技術をいかにAIに適用できるかが、大きなトピックになっていた」という。その中でも特に、計算機をいかに冷やすかが大きなテーマだった。
スーパーコンピューターの運用では、2017年のTSUBAME 3.0の段階で水冷システムを採用している。現在運用中の富岳も、ほぼ100%水冷だ。具体的には、CPUに冷却プレートを密着させるDLC(Direct Liquid Cooling)だが、「現在GPUのトップベンダーであるNVIDIAも、DLCに非常に力を入れていることが感じられた」という。
チップはDLCで冷やすとして、残りの部分をどう冷やすかもテーマとなっている。三浦氏は、2017年から産業技術総合研究所でABCIデータセンターの構築と運用にも携わっていたが、そこではPOD(Performance Optimized Datacenter)を採用していた。
PODは電力、冷却、ラック、アイルコンテインメント、モニタリングなどの主要システムを統合したモジュール化されたデータセンターで、SC25ではこのPODが数社から出展されていたという。「我々のやっていたことが認められたというか、周りが追いついてきた」と三浦氏は言う。
もうひとつ話題になっていたのが電源関連で、NVIDIAのポートフォリオに直流800Vを使うGPUが入ってきたというものだ。これについて錦織氏は、「実現するためのさまざまな展示がされていたが、まだ安全性などの検討段階という印象」だと述べた。特に日本では、法規制の問題がある。
データセンターにおける課題
須田氏は、「データセンターはGPUベースでサービスが展開されるというのがトレンド」と見ている。シュナイダーエレクトリックでも、チップの特徴から製品設計をするなど、NVIDIAとコミュニケーションをとっている。「メインのプレーヤーが変わった感じ」(須田氏)だという。
データセンターにおける課題については、三浦氏は冷却と電源を挙げる。冷却については、「1ラック当たり1メガを超えると液浸でなければ冷やせない」(三浦氏)とのこと。液浸冷却はひとつの有望な手法とされ、AIデータセンターでも必要になる可能性がある。その技術開発が必要だろう。
また電源については、日本では一般的な工事が可能な電圧が750Vまでに制限されていることが大きな課題となる。データセンターでNVIDIAの直流800Vのチップを採用するためには、法改正が必要となる。
データセンター事業者の視点では、「SC25の展示は最先端なので、そこにあるものが実際にデータセンターに入るのはもう少し先」だと錦織氏は考えている。ただし、顧客から要望があればすぐに対応できるように準備しておく必要がある。「施設側としては、どんな要件が来ても対応できるように、コスト・納期などのバランスをとってどう柔軟性を確保していくかが今後の課題」(錦織氏)だ。
それには、サーバーから設備までの状態を見える化し、最適な運用をすることも重要になる。その意味で、SC25では「デジタルツイン」がかなり取り上げられていた。NVIDIAが提唱するデジタルツインは、機械、熱、ネットワーク、電気システムといった複数の入力情報をまとめて、AIファクトリーの運用をシミュレートするものだ。
錦織氏によれば、アット東京でもDCIMなどでさまざまなデータを取得しているものの断片的になっているため、それらをいかに統合しサービスに落とし込むかが、これからの課題だと認識しているという。
また、コンピューティングや冷却の技術進歩が早く、標準設計を定めにくいというのも課題だという。省力化やスピードアップのための標準化は必要だが、新しい技術に速やかに対応できないと、設備がすぐに陳腐化してしまう。
対策としては、高集積化により耐床荷重の要求が上がっているが、床荷重は運用開始後に変更するのは大変なので、あらかじめ大きな値で設計しておくのがよいようだ。また、設備スペースを広めにとっておくと、新しい空調方式などが出てきても対応しやすい。
SC25ではAIが大きなテーマだった。三浦氏によれば、「今後は、AIのインフラだけでなく、AIをいかに活用するかという観点でも技術開発が進むだろう」という。日本でも「SCA/HPCAsia2026」というイベントが開催されるので、興味があればぜひ参加してほしい。




