ニュース

フィックスターズ、さくらインターネットの「高火力 PHY」H200搭載モデルをAI Boosterでパフォーマンス最大化

三柳英樹

2025年6月16日 10:00

　株式会社フィックスターズは13日、さくらインターネット株式会社のベアメタル型GPUクラウドサービス「高火力 PHY」のNVIDIA H200搭載プランについて、パフォーマンスエンジニアリングプラットフォーム「Fixstars AI Booster（以下、AI Booster）」の動作検証を行い、前モデル（H100）に対して2.5倍の高速化を達成したと発表した。

　AI Boosterは、GPUなど計算リソースの利用効率を最適に保ち、常に高いパフォーマンスを維持し続けることを目的としたソフトウェア。パフォーマンスの観測と改善のサイクルを支援する、パフォーマンスオブザーバビリティ（Performance Observability：PO）と、パフォーマンスインテリジェンス（Performance Intelligence：PI）の2つの機能を提供している。

　フィックスターズは、さくらインターネットと連携し、「高火力 PHY」で新たに提供開始したH200 アーキテクチャGPUにおいても、AI Boosterによるパフォーマンス観測と改善が有効に機能して、高速化を実現できることを確認した。

　大規模な生成AIモデルの処理では、特に学習時にはGPUメモリが不足する問題が頻発することが知られている。例えば、前モデルのH100では、70B級のモデルの事前学習を2ノードで実行するためには、処理速度や精度を抑えてメモリ消費量を節約する必要があった。

　一方、H200では、H100に比べてメモリが増強されているため、このような問題が緩和でき、処理速度や精度の向上が期待されていた。今回、実際にAI Boosterを適用することで、前モデルであるH100と比較して2.5倍の高速化を達成、処理時間は約60％の短縮ができたことを確認した。

　動作検証内容は、学習手法が事前学習、対象モデルはLlama 3.1 70B、学習データはRedPajama-Data-1T arXiv、使用フレームワークはMegatron-LM。AI Boosterによる事前学習処理のH200高速化施策は、　高精度なoptimizerの使用（SGD-SaI -> Adam）、高速な演算器の使用（fp16->fp8）、再計算量の削減（recompute-granularity full -> selectiveなど）。

H100／H200 比較結果

Fixstars AI Booster パフォーマンス・オブザーバビリティ画面

　さくらインターネットの「高火力 PHY」契約者には、サーバー使用開始時にAI Boosterのインストールキットが提供される。フィックスターズが「高火力 PHY」上で検証済みの導入・運用手順が提供されるため、簡単に使用できる。また、希望に応じてフィックスターズのエンジニアによる導入支援や、GPUサーバーの維持管理支援も提供する。運用開始後、さらに高いパフォーマンスを求める顧客には、GPU向け高速化支援も行っている。