ニュース
ソフトバンク、AI用途向けクラウドサービス「AIデータセンター GPUクラウド」を10月に提供開始
2026年5月26日 11:00
ソフトバンク株式会社は25日、新たな成長戦略「Activate AI for Society」の下、ネオクラウド事業として、AI(人工知能)データセンター向けのソフトウェアスタック「Infrinia AI Cloud OS」を搭載したクラウドサービス「AIデータセンター GPUクラウド」を、10月に提供開始すると発表した。提供に先立ち、25日からベータ版を展開し、ソフトバンクおよびグループ会社での利用を開始する。
「AIデータセンター GPUクラウド」は、マルチテナント環境に対応したKubernetes as a Service(KaaS)や、大規模言語モデル(LLM)の推論機能をAPIとして提供するInference as a Service(Inf-aaS)を利用できる、AIデータセンター向けのソフトウェアスタック「Infrinia AI Cloud OS」と、ソフトバンクのAI計算基盤を組み合わせたクラウドサービス。
ソフトバンクが国内のデータセンターに構築した「NVIDIA GB200 NVL72」など最先端のGPU搭載のAI計算基盤を活用することで、日本国内における安全なデータ管理・運用の下、AIモデルの学習から推論、データ処理まで幅広いAIワークロードを効率的かつ柔軟に実行できる。また、GPUの管理やKubernetesによる運用、AIワークロードの実行などを一元管理および自動化することで、最適な環境で各ワークロードの処理が可能。これにより、開発環境の構築や計算リソースの調整などにかかる手間を削減し、運用負荷とコストの低減を実現するとともに、変化する要件にも柔軟に対応できる安定した環境を実現する。
LLMの開発など大量の計算資源を必要とするAIの学習用途から、迅速なレスポンスが求められる推論用途まで、幅広いワークロードに対応したGPU環境を提供する。NVIDIA GB200 NVL72をはじめとする最先端のアクセラレーテッドコンピューティング基盤上で、NVIDIA NVLinkを介して相互接続された高性能なNVIDIA Blackwell GPU間の通信と高性能なストレージを組み合わせることで、マルチテナント環境においても、LLMの学習や複雑な推論処理に適した環境を実現する。
Kubernetesを活用することで、多数のコンテナを一元的かつ自動的に管理でき、開発環境の構成変更やスケーリングといった煩雑な運用負荷を軽減する。また、コンテナ技術により、アプリケーションの起動を高速化するとともに、デプロイやスケーリングを効率化し、AIモデルの開発から実装、運用までの一連のプロセスを迅速化する。さらに、Kubernetesによる負荷分散により安定したサービス提供を可能にするとともに、障害発生時に自動復旧する仕組みにより、高い継続性を実現する。
Kubernetes上でのモデル推論基盤の構築・運用を自動化することで、推論APIの構築を支援する。これにより、インフラ管理にかかる負荷を軽減して、独自開発のAIモデルや任意のAIモデルを選択するだけで、迅速かつ安定した推論環境を利用できる。
ソフトバンクは今後、通信基盤を生かしてAI時代の社会インフラを構築するTelco AI Cloud構想に基づき、「AIデータセンター GPUクラウド」と「AI-RAN」を統合することで、学習から推論までのAIの計算処理の最適化を図るとともに、低遅延・高信頼を実現するソブリン性を備えた分散型のAIインフラの構築を目指すとしている。
