トピック
最新プロセッサーに負けないハードウェアを――、
エフサステクノロジーズが取り組むサーバー製品の最適化と、それを支える保守・サポート体制
- 提供:
- インテル株式会社
2024年4月2日 09:00
第5世代インテル Xeon スケーラブル・プロセッサー(以下、第5世代 Xeon SP)を搭載するPCサーバー「PRIMERGY 2WAY M7シリーズ」は、顧客のデジタルイノベーションを支えることを実現するために開発された。
同シリーズでは、大容量ファイルサーバーや高性能エッジコンピューティングなどのさまざまな用途で使えるタワー型サーバー、クラウド基盤、テレワークやデータベースでCPU性能を最大限に生かせるように設計を一新したラック型サーバー、大規模シミュレーションや生成AI向けモデル、サーバー環境をスリム化する省スペースモデルといった特定ソリューションに最適化されたものまで、豊富なラインアップを提供する。
また、複雑化しがちなITインフラ管理をシンプルにし、AIでシステム管理の負荷を軽減するソフトウェア「Infrastructure Manager」で、サーバー運用面でもイノベーションを支える。非常に多岐にわたる利用シーンで、性能とサステナビリティを実現しながらのソリューションを提供できる環境が整っているという。
本稿では、コアとなるプロセッサーの概要から開発のポイント、そして独自の特徴的な機能を解説していく。
なお、PRIMERGYは2024年4月1日にサーバー・ストレージおよびネットワーク製品を中心としたハードウェア事業の専業会社としてスタートした、エフサステクノロジーズ株式会社から提供される。同社は開発・製造・販売から保守まで一貫して担う体制を生かし、お客様の声をいち早く製品へフィードバックすることで、より高品質で信頼性の高い商品を生み出していき、幅広い製品と最適に組み合わせたトータルソリューションとして提供していく。また、ハードウェアソリューションを通して、お客様のデジタルトランスフォーメーションを支援するとともに夢のある未来の共創に取り組んでいくという。
今回は、プロダクトソリューション事業本部 システムビジネス推進統括部 PRIMERGY推進部 館野巌部長、尾藤篤シニアマネージャーのお2人に話をお伺いすることができた。新会社がスタートする直前の大変忙しい時期にインタビューに対応いただき大変感謝している。
第5世代 Xeon SPの特徴を振り返る
まずは、インテルのデータセンター向け最新プロセッサーについて、もう一度確認しておこう。
この第5世代Xeon SPにおける、4つの進化のポイントがこちらだ。
・AI向けに設計されたプロセッサー
・ワークロードに最適化されたパフォーマンス
・電力効率の向上
・イノベーションを加速するデータ・セキュリティ技術を搭載
前世代の第4世代インテル Xeon スケーラブル・プロセッサー(以下、第4世代 Xeon SP)は、発表まで時間がかかった印象だが、かなりいろいろ考えられたプロセッサーとなっていた。今回の第5世代Xeon SPでは、その第4世代Xeon SPと同じIntel 7プロセスとコアアーキテクチャを採用しながら、さらに堅実に進化したプロセッサーとなっており、ハードウェアとして、CPUの最大コア数が増加したほか、メモリ速度、キャッシュサイズ、I/O帯域幅などが強化された。具体的には、メモリ速度は4800MT/sから5600MT/sへ高速化され、ラストレベルキャッシュは最大3倍に強化された。UPIなどのI/Oも向上し、データの流れが大幅に強化されている。
また、実ワークロード処理の効率を上げるアクセラレーターは、特徴的な進化をしており、電力効率向上、セキュリティ、マックス・シリーズ用HBM2対応といった強化が行われている。
従来のプロセッサーとしての素性の良さと性能向上だけでは、データセンター事業者の期待する進化には足りず、アクセラレーターを十分に利用して、エネルギー効率を向上しながら性能を上げていくという必要性に答えるための進化だったといえる点だが、こうした強化を行いながらも、今回の第5世代Xeon SPでは、第4世代製品のリリースから1年も経たずに製品を発表してきた。
そして、第4世代Xeon SPと比較して、平均的なパフォーマンスは21%向上し、AI推論やHPC環境では40%以上、ネットワーク/ストレージでは70%の性能向上が見られる。インテルがCEOにパット・ゲルシンガー氏を迎えてからの事業改革の一環として投入された製品であり、インテルの半導体開発力が垣間見えるといえる。
なお第5世代Xeon SPの構造は、2つのタイルがEMIBで接続されたものとなっており、1タイルあたり最大32コアを搭載。第4世代とはソケット互換性があるため、プラットフォームの載せ替えは容易である。
また前述した通りに、AI向けに設計されたCPUであり、インテルDLブーストやインテルAMXといった機能も搭載しているほか、インテルトラスト・ドメイン・エクステンションズなど、データセキュリティ機能も強化されている。
このうちインテルDLブーストは、INT8やBFLOAT16などの低精度のデータ型をサポートし、AI推論のパフォーマンスを高める技術。インテルAMXは、INT8やFP16などのデータ型をサポートし、AI推論やトレーニングのパフォーマンスを高める技術だ。
またインテルトラスト・ドメイン・エクステンションズは、仮想マシンやコンテナなどのワークロードを暗号化し、外部からの攻撃や内部からの漏えいを防ぐ技術で、第5世代では、より多くの製品バリエーションで利用できるようになった。
このほか、アクティブ・アイドル・モードは、CPUの電力効率を向上させる技術である。第5世代Xeon SPでは、最適化電力モードを有効化し、完全統合型の電圧レギュレーターをコントロールすることにより、高効率化を実現している。
最新プロセッサーの性能を最大限に引き出すサーバー「PRIMERGY 2WAY M7シリーズ」
続いて、PRIMERGY 2WAY M7シリーズの特徴となる点を、エフサステクノロジーズの資料から抜粋してみよう。
昨年3月に発表された、第4世代Xeon SP搭載PRIMERGY M7シリーズの、最新プロセッサー搭載モデルになる。特徴は、以下のような点だ。
・最新DDR5メモリ搭載で性能大幅向上
・HPC・データベースや仮想デスクトップに最適
・新設計により消費電力を削減し、TCO削減に貢献する「RX2530 M7 / RX2540 M7」
・高性能GPU搭載により、エッジコンピューティングに対応、高性能と静音性を兼ね備えたタワー型サーバー「TX2550 M7」
・19インチラックのたった2Uの設置スペースに、最大4台のサーバーを搭載可能。さらに・大規模HPC向け水冷サーバーをラインアップしたシャーシ型「CX400 M7」
こちらのサーバーでは、単純にプロセッサー搭載による性能向上ではなく、最新プロセッサーの性能を最大限に引き出すためにシステム内での最適化が施されており、TCO、持続可能性、運用者側の利便性までもサポートできる製品として開発・提供されている。
館野氏は、「第5世代Xeon SPは性能が汎用的にも上がっていますし、AI性能が向上していることから、昨今、生成AIに対する関心が高まる中での、お客さまからの期待にも応えられると思っています」とコメントした。
第3世代Xeon SPから第4世代Xeon SPでは性能が約50%、また第4世代Xeon SPから第5世代Xeon SPでは性能が21%向上しているが、最新サーバーは、その性能向上を生かせる設計になっているわけだ。
これらの特徴を、もう少し丁寧に説明していこう。
尾藤氏によると、第4・5世代インテル Xeon スケーラブル・プロセッサー(以下、第4・5世代Xeon SP)用の筐体設計では、プロセッサーの性能を最大限引き出すために、筐体設計や排熱設計を最適化しており、プロセッサーの持つ高い性能を引き出せているということだった。
具体的には、電源配置の変更による排気の効率化、放熱板の設計の見直しなども含めたヒートシンク改善、ファームウェアによる環境温度や機器構成に合わせた冷却ファンユニットの回転数の最適化などで、ラックやタワー型の筐体の外見上は変更がないように見えるが、内部から見ると、新設計となる構造により、プロセッサーの性能向上をプラットフォームレベルで最大限に引き出すことを可能にしている。
またHPC向けの水冷機構を搭載できるマルチノードサーバーなど、限られたスペースと電力の中で、最も効率よくコンピューティングパワーを引き出すための設計も行われており、これらのプラットフォーム開発技術により、高い電力あたりの性能と高信頼性を両立させているのだ。
もちろん用途によっては、第4・5世代Xeon SPが搭載しているアクセラレーターの機能を生かすことも可能。富士通からエフサステクノロジーズに引き継がれたプラットフォーム技術と、インテルのプロセッサー技術の組み合わせにより、今後増えていくであろう、アクセラレーター機能を利用する環境についても高い性能を提供できると、尾藤氏は話している。
単なるハードウェアベンダーを超えた価値を提供
なおPRIMERGYでは、ハードウェアとしての性能と持続可能性を高い次元でバランスさせるために、ソフトウェア技術も合わせたソリューションの提供を行っている。ここが単なるシステムのサプライヤーを大きく超えた"ソリューションプロバイダー"としての価値といえるだろう
その1つが、サーバーに標準実装されたBMC+IPMI(FW)によるiRMC(integrated Remote Management Controller)と、インフラストラクチャーマネージャー(ISM)による運用管理面での取り組みだ。このうちiRMCは、サーバー単体のリモート監視を受け持ち、一方のISM(インフラストラクチャーマネージャー)は、サーバールーム全体を対象とした統合運用管理ツールである。
ここでは、ISMの価値を紹介しよう。
仮想化が利用され始めてから20年が過ぎ、1サーバー・1OSのようなシンプルな構成ではなく、仮想化により、1ノード内で複数のタスクが実行されることが当たり前になった今では、サーバー内のソフトウェア構成が複雑になったことで、管理が相当に難しくなってきている。
そこで、物理/仮想両システムの可視化により運用面での負担を軽減するなど、単なるサーバー本体の管理ツールという領域を超えたソリューションを用意した。これがISMで、サーバーに加え、ストレージやネットワークスイッチなどのICT機器からファシリティ機器までを、統合的に管理・運用することができるという。
具体的には、それらの機器の設置状態やネットワーク接続状態、温度管理などをビジュアルで確認できるほか、ネットワークに接続されているサーバーをISMが自動検知し、機器登録から設定までをISM経由で実施するといった機能までが搭載されている。
また尾藤氏によれば、仮想化されたタスクで障害が起こった場合に、その障害が物理的にどこのハードウェアとひも付いているかといったこともISMで特定できるそうで、運用面でも利便性を提供できるのが強みといえるだろう。
さらに特筆すべき点は、リソース変動予測機能だ。この機能では、AIロジックを応用して、例えばストレージ使用率の増加傾向を解析し、将来起こりうるリソースの枯渇などを事前に予測できるとのことで、尾藤氏はこの機能を利用することで、設備コストの最適化や、属人化の解消、運用の省人化などを図れると説明している。
このように、可視化とAIによる予測が現実的なソリューションとして用意されていることも、PRIMERGYの大きな導入理由になるだろう。
また、CDI(コンポーザブル・ディスアグリゲーティッド・インフラストラクチャー)により、運用やTCOを改善可能なソリューションも提供している。
CDIとは、システムから分離された(disaggregated)ハードウェアリソース(例えばGPUアクセラレーターなど)を、ファブリック経由で複数の計算サーバーと共有可能なリソースプールに集約。計算サーバーからの要求に対して、リソースプールから必要なリソースをその都度割り当てるシステムだ。
こうした共有の仕組みがない場合は、計算サーバー側すべてにGPUなどのハードウェアリソースを搭載しなければならず、コスト面の負担が見込まれるため、必要な分だけを稼働させることができるCDIはサステナビリティにも貢献できると考えられている。まだ提供は始まったばかりだが、将来的にも期待できるソリューションだといえる。
サステナビリティへの配慮、他社を凌駕する保守対応なども魅力
PRIMERGYでは性能、運用面の特徴に加え、ECOサステナビリティも非常に重要に考えており、環境に配慮した設計を進めている。HPC向けの水冷や、ラック・タワー型筐体内でのヒートシンク等の熱処理用設計の改善、吸気・排気の流れを最適化するために筐体内のレイアウトを変更するといった改善は、富士通で35年以上、環境に配慮した開発・設計を進めてきたことで可能になっているという。
なお、EPEAT(グリーン・エレクトロニクス協議会:Green Electronics Councilが定める環境配慮された製品に対する基準)を取得するなど、認証取得にも力を入れており、現状では、環境配慮に関して先行している1社になっているとのことだ。
また管理・運用の面からは、前述のように、ISMなどによる運用管理の効率化に力を入れているほか、保守でも競合他社と比べた強みを持っている。それが、2時間以内のオンサイトサポートを日本全国(離島を除く)で提供可能な点で、館野氏によれば、これはサポートを提供する拠点、パーツセンター、そしてエンジニアをはじめとする人員が、日本全国に用意されているからだという。また、この人員を含んだ体制こそが他社との大きな差別化になっていると説明してくれた。
またソフトウェアの保守についても、他社製品を含めて対応できる体制が整えられているので、問題をたらいまわしにされることなく、"ワンストップ"で対応可能になっている。「トラブルの切り分けについてさまざまなベンダーとのやり取りが発生することがありますが、当社であれば、一括して託してお客さまに回答するので、長年ワンストップでやってきた強みを実感いただけると思います」(尾藤氏)。
*****
今回のインタビューは、ハードウェアの性能に注目したところからスタートしたが、運用面を含めた利便性や可用性を、プラットフォームベンダーとしてどのようにサポートしていくべきかを考え、その時代その時代での最善な対応で市場に提供してきたという点を、あらためて理解することができた。
また、ハードウェアだけでなくOS・ミドルウェア、運用面をサポートするソフトウェア、そしてそれらを一括サポートするサポート拠点など、最も進んだ環境を提供していることが、長年の実績の上で可能になるという点も理解できた。こうした同社ならではの長所が、今後どのように進化していくのかについて、期待していきたいと思う。
また館野部長、尾藤シニアマネージャーのインタビューの対応について、あらためて感謝を申し上げたい。