ニュース

富士通、AI処理におけるGPUの演算効率を高めるミドルウェア技術「AI computing broker」を開発

さくらインターネットなどとの実証実験で効果を確認

 富士通株式会社は22日、世界的なGPU不足に対応するため、高い実行効率が見込める処理に対して、リアルタイムにGPUを割り振る独自のアダプティブGPUアロケーター技術と、各種AI処理の最適化技術を統合したミドルウェア技術「AI computing broker(以下、ACB技術)」を開発したと発表した。

 同技術は、オンプレミスだけでなくクラウドで提供されているGPU環境においても利用可能で、単一のGPUを用いるAIアプリから複数のGPUを用いる大規模言語モデルまで、幅広く活用できると説明。単一のGPUによる先行トライアルの技術検証結果を踏まえた上で、10月からトレーダム株式会社がACB技術を採用し、また、さくらインターネット株式会社が富士通と共同で複数のGPU上でACB技術の実証実験を開始するとしている。

 富士通は、生成AIをはじめとする世界的なAI需要の爆発的な高まりを受け、AI処理に最適とされるGPUの需要も急激に増加している一方、GPUの不足や、GPUの需要に応じたデータセンターにおける消費電力の増加が課題となっていると説明。こうした世界的な社会課題に対応するため、富士通では、GPUでプログラムを実行中でも、高い実行効率が見込める処理に対してリアルタイムかつ優先的にGPUを割り振り、CPUとGPUの計算リソースを最大活用できるアダプティブGPUアロケーター技術を2023年11月に開発し、さまざまなプラットフォーム上での効果検証を進めてきた。

 富士通では、さらなるGPU不足への対応を見据え、GPUサーバー上で動作するAI処理に対して、計算処理を自動で最適化するミドルウェア技術となるACB技術を開発した。ACB技術は、アダプティブGPUアロケーター技術と各種AI処理の最適化技術を統合したミドルウェア技術で、複数のプログラム中のGPUを必要とするAI処理部を見極め、計算資源の割り当てや最適化を自動的に適用する。

 従来技術のジョブ単位での割り当てとは異なり、富士通が培ってきた演算最適化技術により、動的にGPU資源をGPU計算単位で割り当てて稼働率を向上させるほか、同技術のGPUメモリの管理機能により、ユーザーはプログラムが使用するGPUメモリ量や、GPUの物理的なメモリ容量を気にすることなく、多数のAI処理を割り付けられる。

 富士通は、トレーダムとさくらインターネットのほか、AWL株式会社、エクストリーム-D株式会社、モルゲンロット株式会社と、単一GPUによるACB技術の先行トライアルを2024年5月から順次実施。ACB技術非適用の場合と比較して、顧客環境におけるGPUの単位時間あたりの処理性能で、最大2.25倍の向上を確認した。

 また同技術には、アプリ動作を見ながらGPUのメモリを共有するメモリ管理機能が備わっており、ユーザーは各ジョブの総メモリ使用量が物理メモリの最大容量に収まるかどうかを気にせずに、処理を実行できる。これにより、最大でGPUの物理メモリ容量の約5倍に当たる、150GBものメモリを必要とするAI処理を同時に取り扱えることを確認した。

 富士通は今後も、AI処理におけるGPUの演算効率を高めてGPUコストを削減したいAIサービス事業者や、一つのGPUにできるだけ多くのAI処理を割り当てたいクラウドサービス事業者などの、GPU資源提供者に同技術を提供し、世界的なAI需要の高まりに伴うGPU不足や電力問題などの課題を解決し、AIによる顧客ビジネスの生産性と創造性の拡張に貢献するとしている。

ACB技術概要