ニュース
フィックスターズ、さくらインターネットの「高火力 PHY」H200搭載モデルをAI Boosterでパフォーマンス最大化
2025年6月16日 10:00
株式会社フィックスターズは13日、さくらインターネット株式会社のベアメタル型GPUクラウドサービス「高火力 PHY」のNVIDIA H200搭載プランについて、パフォーマンスエンジニアリングプラットフォーム「Fixstars AI Booster(以下、AI Booster)」の動作検証を行い、前モデル(H100)に対して2.5倍の高速化を達成したと発表した。
AI Boosterは、GPUなど計算リソースの利用効率を最適に保ち、常に高いパフォーマンスを維持し続けることを目的としたソフトウェア。パフォーマンスの観測と改善のサイクルを支援する、パフォーマンスオブザーバビリティ(Performance Observability:PO)と、パフォーマンスインテリジェンス(Performance Intelligence:PI)の2つの機能を提供している。
フィックスターズは、さくらインターネットと連携し、「高火力 PHY」で新たに提供開始したH200 アーキテクチャGPUにおいても、AI Boosterによるパフォーマンス観測と改善が有効に機能して、高速化を実現できることを確認した。
大規模な生成AIモデルの処理では、特に学習時にはGPUメモリが不足する問題が頻発することが知られている。例えば、前モデルのH100では、70B級のモデルの事前学習を2ノードで実行するためには、処理速度や精度を抑えてメモリ消費量を節約する必要があった。
一方、H200では、H100に比べてメモリが増強されているため、このような問題が緩和でき、処理速度や精度の向上が期待されていた。今回、実際にAI Boosterを適用することで、前モデルであるH100と比較して2.5倍の高速化を達成、処理時間は約60%の短縮ができたことを確認した。
動作検証内容は、学習手法が事前学習、対象モデルはLlama 3.1 70B、学習データはRedPajama-Data-1T arXiv、使用フレームワークはMegatron-LM。AI Boosterによる事前学習処理のH200高速化施策は、 高精度なoptimizerの使用(SGD-SaI -> Adam)、高速な演算器の使用(fp16->fp8)、再計算量の削減(recompute-granularity full -> selectiveなど)。
さくらインターネットの「高火力 PHY」契約者には、サーバー使用開始時にAI Boosterのインストールキットが提供される。フィックスターズが「高火力 PHY」上で検証済みの導入・運用手順が提供されるため、簡単に使用できる。また、希望に応じてフィックスターズのエンジニアによる導入支援や、GPUサーバーの維持管理支援も提供する。運用開始後、さらに高いパフォーマンスを求める顧客には、GPU向け高速化支援も行っている。