ニュース

ソフトバンクとAMD、AMD Instinct GPUを次世代のAIインフラに活用する共同検証を開始

 ソフトバンク株式会社は16日、米Advanced Micro Devices(以下、AMD)と連携し、AMD Instinct GPUを次世代のAIインフラの計算資源として活用するための共同検証を開始したと発表した。

 検証では、ソフトバンクが開発を進めている、計算資源の管理やAIアプリケーションの最適な配分を行うオーケストレーターを拡張し、AIアプリケーションのモデルの規模や同時実行可能数などの要件に応じてGPUを分割し、最適に割り当てる機能を開発した。これにより、ユーザーの要求に応じて、AMD Instinct GPU上で複数のAIアプリケーションを効率的に動作させることが可能になるとしている。

オーケストレーターによるAMD Instinct GPUの制御

 生成AIの活用が進む中、大規模言語モデル(LLM)などのAIモデルを活用したアプリケーションの需要は拡大を続けており、特にLLMでは、AIモデルのパラメーター数や同時実行数によって必要な計算資源が大きく異なるため、計算資源を一律に割り当てるとGPUリソースのひっ迫や余剰などが発生し、非効率な運用となる場合がある。

 こうした背景のもと、ソフトバンクは、AIアプリケーションのモデルの規模や実行要件に応じて計算資源を柔軟に制御できる次世代のAIインフラの実現を目指し、計算資源の管理やAIアプリケーションの最適な配分を行うオーケストレーターの開発を進めてきた。

 ソフトバンクはAMDとの連携により、AMD Instinct GPUが備えるGPUパーティショニング機能(1台のGPUを複数の論理デバイスとして利用可能にする機能)を活用したオーケストレーターの拡張機能を開発した。この機能により、AIアプリケーションのモデルの規模や同時実行可能数などの要件に応じてGPUを分割し、柔軟かつ最適に割り当てることが可能になる。1台のGPU上で複数のAIアプリケーションを効率的に動作させることが可能となり、GPUリソースのひっ迫や余剰の発生を抑えた運用を実現できる。

 ソフトバンクとAMDは、今後も次世代のAIインフラにおけるAMD Instinct GPUの活用の可能性について技術評価を進めていくとしている。