イベント

「AWS re:Invent 2022」3日目の基調講演レポート、リソースも含めたRedshiftの冗長化を実現する「Multi-AZ」などを発表

Amazon DocumentDB Elastic Cluster、SageMaker関連の新サービスなども

 Amazon.comの子会社でCSP(クラウドサービスプロバイダ)最大手の米Amazon Web Services(AWS)は、11月28日~12月1日(現地時間、日本時間11月29日~12月2日)の4日間にわたって、同社の年次イベント「AWS re:Invent 2022」を、米国ネバダ州ラスベガス市にある「The Venetian Convention and Expo Center」を中心とした会場において開催している。

 3日目となった11月30日(現地時間、日本時間12月1日未明)には、同社 データベース・アナリティクス・ML担当副社長 スワミナサン・シヴァスブラマニアン氏が登壇し、データベース、アナリティクス、マシンラーニングなどに関する新しいサービスの発表を行った。

AWS データベース・アナリティクス・ML担当副社長 スワミナサン・シヴァスブラマニアン氏

現代の発明の母はデータであり、それを見つけるマシンラーニング、アナリティクスの活用は企業にとって死活的に重要

 AWSの年次イベントAWS re:Invent 2022は会期3日目を迎え、午前中には、AWS データベース・アナリティクス・ML担当 副社長 スワミナサン・シヴァスブラマニアン氏によるマシンラーニング、アナリティクス、データベースに関する詳細サービスを説明するマシンラーニング・アナリティクス関連の基調講演が行われた。

 シヴァスブラマニアン氏は、「この夏に、学生の私の子供たちと話していて、科学者はどうやって素晴らしいアイデアを発明したのか?という質問をされた。その時はすぐに答えないでじっくり考えてから、それはきっと人間の営みというか、そういうドラマが発明の背景にあり、まだまだそうした探検は可能だと答えた。マイクロ波の原理を使って電子レンジを開発したパーシー・スペンサーは、レーダー装置の実験中にマグネトロン(真空管)の前に立った時に、偶然にマイクロ波の原理を発見したといわれているが、それも彼が20年にわたってマグネトロンを研究してきた経験があったからだ」と述べ、電子レンジに採用されているマイクロ波の原理を、ポケットに入れていたチョコレートが溶けていたことで発見したと言われているパーシー・スペンサーの例を出して、発明にはさまざまなドラマがあり、かつ、その発端となるような発見があると説明した。

1945年に発売された最初の電子レンジ
パーシー・スペンサーがマイクロ波の原理を発見し、1945年最初の電子レンジの開発につなげた

 その上で、「人間の観察力は、アナリティクスのプロセスに比べて強くはないかもしれない。しかし、人間の心の内はデータの中に潜んでおり、それは組織の課題も同様だろう。データをどのように活用するかというプロセスが価値を最大化するには重要だ。私はデータこそが現代の発明の発端だと信じており、それをアイデアという形にするために正しいデータ戦略を構築し、それを顧客体験につなげていく必要がある。AWSはそうした基盤として、すべてのワークロードをサポートするツール、スケールアップ・ダウンが可能な性能、重負荷を取り除き、信頼性があり伸縮可能であるという4つの価値を提供する」と述べ、企業が新しいサービスを考えて顧客に優れたユーザー体験として提供していくためには、データの解析、つまりマシンラーニングやアナリティクスなどの手法を利用して所有しているデータを正しいツールを利用して行う必要があり、AWSはそれが提供できると強調した。

Redshiftを演算リソースも含めて冗長化する「Multi-AZ」、S3からの自動コピーを標準機能にする「auto-copy from S3」

 そのシヴァスブラマニアン氏は、合計すると13個の新しいサービス提供開始やプレビュー開始をアナウンスした。以下、日本のAWSユーザーに注目されそうなものから紹介していきたい。

Amazon Redshift Multi-AZ

 Amazon Redshiftで、複数のアベイラビリティゾーン(AZ)にサービスを配置し、障害が発生したとしても、障害が発生していない方のAZに切り替えて運用を継続できる仕組み。Amazon Redshiftでは、標準状態でもストレージレベルの冗長化は行われているが、このMulti-AZでは、コンピューティングリソース(例えばCPUやGPUなど)も含めて冗長化できる。このため、1つのAZに障害が発生しても、別のAZに切り替えれば、処理も含めて継続することができる。

 なお、AZが設定できるのは同じリージョン内となるので、例えば東京と大阪でそれぞれにAZを設定して切り替えるという使い方は、Multi-AZだけではできない。しかし、例えば東京だけでも4サイトあるので、それらのサイトにおいてそれぞれAZを切り替えることで、災害で1つのサイトが止まったとしても業務を継続できるという。

 Amazon Redshift Multi-AZは、現在、東京を含む複数のリージョンでプレビュー提供が開始されている。

Amazon Redshift Multi-AZ

Amazon Redshift auto-copy from S3

 Amazon S3にあるデータをAmazon Redshiftに定期的にコピーしたい場合などに利用できるサービス。コマンドやバッチなどを利用すれば、S3からAmazon Redshiftに定期的なコピーをすることは可能だが、それをシステムの操作パネルなどから設定できるようになるのが特徴だ。

 コマンドやバッチなどで同じことができるとはいえ、例えば管理者や担当者の退職などが繰り返されるうちに引き継ぎもあいまいになり、そもそもそのコピー作業はなんためにやっているのかなどがわからなくなり、そのバッチ処理を改良したいと思っても、作った本人が居なくなってから随分立っているので誰にも直せない、といった“ブラックボックス化”は、オンプレミス、クラウドを問わずよく起こるITのトラブルといえる。そうした問題を回避する意味で、システムでできるようになることの意味は小さくない。

Amazon Redshift auto-copy from S3

Amazon DocumentDB Elastic Cluster

 MongoDB互換のデータベースであるAmazon DocumentDBは、JSONワークロードに対応したスケーラブルなフルマネージド(外部に委託して完全に管理してもらう形)のデータベースサービス。Amazon DocumentDB Elastic Clusterでは、Amazon DocumentDBをさらに大規模化し、リソースを柔軟に伸縮して数百万/秒の読み書きが可能になる。こちらもフルマネージドになるため、データベースの管理はAWSが行う形になる。

 こちらも複数のアベイラビリティゾーン(AZ)にまたがる冗長性が提供されており、3つのAZの6カ所にデータが複製されて高い耐久性を実現することも特徴になる。

 Amazon DocumentDB Elastic Clusterは、Amazon DocumentDBが利用できる全リージョン(日本の2つのリージョンも含まれる)で利用可能になっている(ただし、中国/AWS GovCloudは例外)。

Amazon DocumentDB Elastic Cluster

SageMaker関連の新しいサービスなど多彩なサービスが発表される

 そのほかにも、「Amazon Athena for Apache Spark」、「Amazon SageMaker Geospatial ML support」、「Trusted Language Extensions for PostgreSQL」、「Amazon GuardDuty RDS Protection」、「AWS Glue Data Quality」、「Centralized Access Controls for Redshift Data Sharing」、「Amazon SageMaker ML Governance」、「Amazon AppFlowの新コネクタ」、「Amazon SageMaker Data Wrangler 40+ new data sources」、「AWS Machine Learning UniversityでEducator Trainingを提供」などの発表を行っており、以下に写真のキャプションの形で紹介していきたい

Amazon Athena for Apache Sparkでは、インフラのプロビジョニング(構成)なく、1秒以内にApache Sparkのワークロードを実行できる。東京を含む多くのリージョンで一般提供開始
Amazon SageMaker Geospatial ML supportは、地理空間データを利用した機械学習の構築、開発、サービス開始などを容易にする仕組み。現時点ではオレゴンリージョンでだけプレビュー開始されている
Trusted Language Extensions for PostgreSQLは、PostgreSQLの拡張機能を開発できるオープンソースの開発キット。一般提供が開始されている
Amazon GuardDuty RDS Protectionは、インテリジェントな脅威検出を行うGuardDutyが、Amazon Auroraの保護に対応したもの。東京を含む5リージョンでプレビュー開始
AWS Glue Data Qualityは、データレイクのデータ整形を支援するツールで、適用するルールに基づき、データレイクのデータがルール通りかどうかを測定・モニタリングする。東京を含む複数のリージョンでプレビューが開始されている
Centralized Access Controls for Redshift Data Sharingは、複数のRedshiftクラスタでライブデータを効率よく共有する仕組み。東京を含む複数のリージョンで利用可能
Amazon SageMaker ML Governanceは、SageMakerのカスタム権限を定義するAmazon SageMaker Role Manager、モデル管理を合理化するAmazon SageMaker Model Cards、すべてのモデルを1つのダッシュボードでモニタリングできるAmazon SageMaker Model Dashboardから構成されている、SageMakerの新機能。SageMakerが利用可能なリージョンで一般提供が開始されている(ただし、中国/AWS GovCloudは例外)
Amazon AppFlowの新コネクタとして、Facebook AdやGoogle Ad、Microsoft TeamsとZoom Meetingとの接続を実現する22種類の新しいデータコネクタが発表された。既に一般提供が開始されている
Amazon SageMaker Data Wrangler 40+ new data sourcesでは、Google AnalyticsやLinked-Inなどをデータソースとして取り込み、マシンラーニングに利用できる機能が追加されている
AWS Machine Learning Universityで提供されるEducator Trainingは、マシンラーニングを生徒に教える教師に、無料で教育コースを提供するプログラム