ニュース

Oracle Cloud、ベアメタルインスタンス上で最新世代のNVIDIA GPU「A100」を利用可能に

 米Oracleは22日、主要クラウド事業者としては初めて、ベアメタルインスタンス上で最新世代のNVIDIA GPU「NVIDIA A100 Tensor Core GPU」の一般利用が可能となったと発表した。

 NVIDIA A100 Tensor Core GPUをOracle Cloud Infrastructure(OCI)のベアメタルインスタンス上で実行することにより、複雑なAIモデルおよび機械学習システムを、従来世代のGPUを利用する場合と比べて2.5~6倍高速に実行できるという。

 さらに、GPUDirectを用いた複雑なHPCアプリケーションをNVIDIA Mellanox RDMAネットワークで初めて実行できるようになるとのことで、Oracleでは、これによりマイクロ秒のレイテンシで接続された数千GPUのクラスタリングが可能になるため、膨大なコンピューティングパワーをオンデマンドで利用できるとアピールしている。

 なお、新しいベアメタルインスタンス「GPU4.8」は、それぞれが40GBのメモリを搭載した8基のNVIDIA A100 Tensor Core GPUから構成され、そのすべてがNVIDIA NVLinkによって相互接続される。オンボードのCPUには、2.9GHzで稼働するAMD 第2世代EPYC(Rome)プロセッサの物理コアが64基搭載され、それを2048GBのRAMと24TBのNVMeのストレージがサポートしている。

 またNVIDIA Mellanox RDMA Converged Ethernet(RoCE)により500GPU以上のクラスタに拡張でき、1ベアメタルノードあたり1.6TBの帯域幅を得られるとのこと。

 なおOracleによれば、ベアメタルインスタンスに加え、数カ月以内に仮想マシンあたり1/2/4のGPUを配備できるようになるとのことで、これらのインスタンスシェイプは、GPU向けに最適化された事前構成済みのData Science VMなど、既存のすべてのツールセットへのアクセスも提供される。