クラウド&データセンター完全ガイド:イベントレポート

AWSが考えるこれからの最適なデータセンターとは

データセンター・イノベーション・フォーラム2024 オープニング基調講演レポート

 データセンター・イノベーション・フォーラム プログラム委員会とインプレスは、社会的なインフラとなっているデータセンターの今後の方向性を展望するイベント「データセンター・イノベーション・フォーラム2024 オンライン」を、2024年12月5日~6日に開催した。

 データセンター・イノベーション・フォーラムは、データセンター/クラウド基盤サービス事業者に加えて、ゼネコン、サブコン、設計会社、不動産会社や自社でデータセンターを保有するユーザー企業など、データセンター事業に関わる各事業者を参加対象としたイベントとして、毎年開催している。

 通算で33回目となる今回の「データセンター・イノベーション・フォーラム2024 オンライン」は、「生成AIの進化とともに重要度がさらに増すデータセンター。そのあるべき姿と課題を探る」と題して、AI用途などで高消費電力化・高発熱化するサーバーの冷却に対応するソリューションや、コンテナ型データセンター、大手クラウドサービス事業者の動向など、多数のセッションが行われた。ここでは、アマゾン ウェブ サービス ジャパン合同会社(以下、AWS)の巨勢泰宏氏が登壇した、オープニング基調講演の模様を紹介する。

アマゾン ウェブ サービス ジャパン合同会社 常務執行役員 技術統括本部長 巨勢泰宏氏

 Amazon Web Services(AWS)は、サービス開始当初からオリジナルのサーバーなど最適化されたハードウェアを設計して高効率で稼働させてきた。生成AIにより消費電力の増大が課題となっているが、ワークロードに特化した専用チップの開発で、電力消費の抑制にも取り組んでいる。セッションでは、世界中でクラウドインフラ強化を進めるAWSのデータセンター戦略の一端を、アマゾン ウェブ サービス ジャパン合同会社の巨勢泰宏氏(常務執行役員 技術統括本部長)が紹介した。

個別調達ITからサービスとして利用するITへ

 2006年からクラウドサービスを提供しているAWSは、ECサイトAmazonのIT基盤から端を発している。急速な成長を支えるために刷新したIT基盤は、拡張性、弾力性、俊敏性を備え、これを顧客に提供することで、個別調達のIT運用からWebサービスとして利用するITへとシフトさせた。

 北米からサービス展開をスタートし、現在までに世界中の36のリージョンから、240を超えるクラウドサービスを提供している。さらに、今後4つのリージョンにインフラストラクチャを拡張する計画を発表している。日本では、2011年に世界で5番目のリージョンとして東京リージョンが開設された。同時に、日本語での24時間365日のサポートにも対応し、日本の顧客を支援している。

 ここで、AWSのリージョンの考え方を説明しておこう。リージョンとは、データセンターが集積されている物理ロケーションのこと。最低3つの物理的に分離されたアベイラビリティゾーンによって構成される。アベイラビリティゾーンは、近い場所にある複数のデータセンターを束ねて、論理的にひとつのデータセンターとしてまとめている。

AWSのリージョンデザイン

 さらに、アベイラビリティゾーン間は、冗長化されたメトロファイバーによって、高帯域幅、低遅延のネットワークで相互接続されている。AWSでは、可用性・性能・拡張性を最適化するために、独自のルーティングプロトコルを開発し、実装している。アプリケーションを複数のアベイラビリティゾーンで実行できるように設計することで、強い障害耐性を得ることができる。現在、こうしたアベイラビリティゾーンを、世界で合計114個展開している。

 また、ミッションクリティカルなシステムでのクラウド活用が増えるにつれて、広域災害に対応する可用性の要望が高まった。それに応えるために、2018年に大阪にローカルリージョンを開設し、DR用途のセカンダリーサイトとして使えるようになった。その後、2021年に大阪がフルリージョン化されたことで、大阪単体での利用はもちろん、全国の企業などが、東京/大阪の冗長構成を取れるようになった。

 こうしたデータセンターとリージョンは、以下のようなグローバルネットワークで相互接続されている。完全に冗長な400ギガのファイバーネットワークバックボーンにより、低遅延、低パケットロスの、高い品質を実現している他、すべてのデータは、物理レイヤで自動的に暗号化され、安全性が確保されている。

グローバルネットワーク

 また、AWSでは専用ルーターやチップ、NIC、停電時の非常用電源、サーバーラックまで、さまざまなコンポーネントを独自開発している。その成果のひとつとして生み出されたテクノロジーが「Nitro System」だ。

 Nitro System Hardwareでは、ネットワーク処理や、ストレージへの入出力、セキュリティ処理といった共通処理を、物理サーバー上のCPUから専用ハードウェアにオフロードできる。これにより、サーバー上のCPU/メモリのほぼ全てのリソースを、顧客が使用するEC2で使えるようになった。

AWSのデータセンター

 AWSのデータセンターといえば、以下のようなイメージだろう。

AWSのデータセンター

 このようなデータセンターが世界中に多数あるが、セッションでは特にセキュリティについて紹介された。データセンターの物理的なセキュリティは、境界防御レイヤ、インフラストラクチャレイヤ、データレイヤに分かれており、それぞれに対するセキュリティ対策を設計している。

 境界防御レイヤでは、建物の出入り口とその周辺において、物理的アクセスを厳密に管理。警備員、フェンス、ゲート、監視カメラ、多要素認証システムなどを配備。また、AWSセキュリティオペレーションセンターが世界中に設置されており、24時間36日モニタリングしている。

 インフラストラクチャレイヤは、電力設備、冷却設備、消火設備などの各種機械にも、監視カメラ、多要素認証システムを完備。

 防御で最もクリティカルな部分であるデータレイヤは、アクセスの制限、脅威検出機器、監視カメラ、システム的な手続きなどのセキュリティ対策を展開。多要素認証でサーバールームの出入りを厳重に管理し、侵入検出システムでセキュリティインシデントの監視と検出、アラート通知する。また、ドアこじ開け、多要素認証未対応の入退出、開け放しを検知するとアラームが起動する。なお、監視カメラの配備と録画映像の保存については、法律および契約上の要件に従っている。

 立ち入り申請は、ビジネスニーズのある者のみに許されている。アクセス権はレイヤごとに付与し、作業完了後速やかに失効する。ベンダーや設備メンテナンスの請負業者が立ち入る際には、作業中、常に従業員が付き添う。

 また、ユーザーデータの保存に使用されるメディアストレージデバイスは、ライフサイクルを通じて厳重に管理されており、デバイスの設置、修理、および破棄の方法について厳格な基準が設けられている。デバイスが製品寿命に達した場合には、NIST 800-88の標準に従って破棄している。

 AWSでは、2600を超える要件について、1年を通じて外部の監査機関による監査を受けている。監査人は監視カメラの録画内容を確認したり、データセンターのすべての入り口や通路を確認する場合もある他、コンプライアンスプログラムとその要件によっては、メディアの取り扱い方と廃棄の方法について外部の監査人が従業員を面接する場合もある。

 緊急時に備えたバックアップ装置として、水道、電気、通信、インターネット接続は、冗長化され、緊急時にもオペレーションの継続が可能。完全な冗長設計の電気系統は、停電の際に無停電電源装置から特定の機能に電力を供給し、発電機から施設全体に非常用電力を供給する。温度と湿度をモニタリングして制御することで、過熱を防止しサービスの可用性を高めている。

データセンターで運用されるAWSのサービス

 コンピューティングを提供する最もベーシックなサービスのひとつが、Amazon Elastic Compute Cloud、通称「EC2」。以下のような世界観を目指している。

  • 世界規模の拡張性と性能
  • あらゆるワークロードに対応
  • コストの最適化
  • 必要な時に利用可能

 メモリ、ストレージ I/O、GPU など、さまざまな技術要件に応えるために、多様なEC2インスタンスを用意している。

あらゆるアプリの要件に対応

 AIやHPCの需要が高まっているが、NVIDIAとは13年以上にわたってパートナーシップを強化してきた。その一環として、AWS上でAIスーパーコンピュータ「Project Ceiba」を、NVIDIAと共同開発している。スーパーコンピュータをクラウドで使うというコンセプトのサービスだ。

サステナビリティの取り組み

 昨今、サステナビリティへの関心が高まっている。

 クラウドは、高いリソース稼働率や効率的なファシリティによって、一般的なデータセンターと比べて、カーボンフットプリントを大幅に削減できると期待されている。加えて、AWSはシリコンレベルの開発を強化することで、サステナビリティにも貢献する。

 その成果がクラウド上のワークロードに特化した専用チップだ。一般的なワークロードのために2018年から提供している「Graviton」はARMベースのプロセッサで、コスト性能に優れているだけでなく、消費電力においても優れた性能を発揮する。最新の「Graviton」は、同等のx86 CPUと比較して、消費電力を最大60%削減する。

クラウド上のワークロードに特化した専用チップ

 さらに、AIや機械学習に特化した、「AWS Trainium」や「Inferentia」というチップは、モデル開発時の学習プロセスのコスト削減に加え、エネルギー効率を25%向上させている。AWSは数年前からプロセッサも提供していることはあまり知られていないかもしれないが、「このシリコンレベルの開発がサステナビリティの促進に貢献している」と巨勢氏は言う。

 一方、データセンターにおける最大のエネルギー消費源のひとつが冷却である。AWSでは冷却効率の革新に継続的に取り組んでいる。例えば、季節に応じて異なる冷却技術を使用し、リアルタイムのセンサーデータを活用して、変化する気象条件に適応。さらに、2022年1月以降にオープンしたデータセンターについては、基本的なデザインを空冷式から水冷式に変更することで、空調システムを効率化している。

 高度な分析や再生可能エネルギーへの取り組みなどもあり、AmazonおよびAWSは、再生可能エネルギー100%の目標を7年前倒しで達成している。

最新のデータセンターソリューション

 少し毛色の違う話として、システムの中には究極の低遅延が必要なものもある。例えば証券取引所のシステムなどだ。この場合、クラウド事業者のデータセンターとの通信における遅延すらも許容できない。しかし、可用性や柔軟性など、クラウドのようなインフラが欲しいというのはどのビジネス分野でも同様だ。

 このようなニーズに応えるために、AWSでは顧客企業の自社データセンターにAWSを延伸する「AWS Outposts」というサービスを提供している。AWSのリージョンで活用されているのと同じハードウェアを搭載したマネージドなサービスで、現在Nasdaqで採用されている。

低遅延が必要なシステム向け「AWS Outposts」

 またAWSは、米国国防総省にモジュラーデータセンター (MDC) 、いわゆるコンテナ型のデータセンターを提供すると発表している。ユニットには、電源設備をはじめとするインフラのアセットが含まれ、内部にはAWS Outpostsのラックを収納、ネットワーク接続に衛星通信を使用できる。

 「大規模な軍事作戦、危機対応、安全保障協力などのシナリオで、インフラが限られた環境で低レイテンシーのアプリケーション実行ができる」というコンセプトなので、現時点では、このサービスは国防総省にのみ提供される。

国防総省向けMDC

 AWSでは、「止まらないデータセンター」を作るために、さまざまな開発や取り組みを行っている。顧客のフィードバックを得て、さらなる改善を進めていくという。