ニュース

NEC、国内企業で最大規模の580PFLOPS超となるAI研究用スーパーコンピュータの構築を開始

 日本電気株式会社(以下、NEC)は17日、AIの世界的な開発競争が激化する中で優位性を維持・強化するため、AI研究用スーパーコンピュータの構築を開始すると発表した。2023年3月に、国内企業で最大規模の580PFLOPS超となるシステムの稼働を予定するとしている。

 NECでは、ディープラーニングが急激に進化し活用領域が広がっており、ディープラーニングの開発に必要な演算量も拡大の一途をたどっているとしえて、社会全体のDXを進めるには、多様な先進AIを迅速に創出できる大規模な計算資源が求められると説明。こうした背景を受け、自社の数百名のAI研究者が利用できるAIスーパーコンピュータを、数十億円を投じて設計・構築するとしている。

AIスーパーコンピュータのマシン室完成予想図

 システムは、1ノード当たり8基のハイエンドGPU「NVIDIA A100 80GB Tensor コア GPU」を搭載した最新GPUサーバー116台(スーパーマイクロ製)と、16PB超のEXAScaler高性能並列ファイルシステム(データダイレクト・ネットワークス製)を搭載したストレージアプライアンスで構成される。

 理論上の処理性能は580PFLOPS超となり、数千万枚の画像を数分間で学習可能になる。また、ネットワークには、高速イーサネットスイッチ「NVIDIA Spectrum SN3700」を採用し、全サーバーを200GbEで接続してRoCE(RDMA over Converged Ethernet)v2により超高速・低遅延での通信を行うことで、高速な分散学習を実現する。

 NECは、オープンソースのコンテナ管理技術であるKubernetesを中核とした独自の構築技術により、これらの先端ハードウェアとソフトウェア群を密に結合することで、高性能かつ利便性の高いシステムを実現するとしている。

 既に、一部のシステム(100PFLOPS)について、NECの数百名のAI研究者が利用を開始しており、今後構築する480PFLPOSのシステムを加え、国内最高峰のAIに特化した研究開発環境による、より高度な先進AIの迅速な開発に役立てると説明。また、将来的には、顧客やパートナーとの共創により先進的な社会価値を産み出す、AI研究のセンター・オブ・エクセレンスの実現を目指すとしている。