ニュース

AWS、DWHサービスのサーバーレス版「Amazon Redshift Serverless」を一般提供開始

Redshift Serverlessを含むAWSのデータ分析サービスについて説明

 Amazon Web Services(AWS)は、データウェアハウス(DWH)サービス「Amazon Redshift」のノード管理が不要なサーバーレス版「Amazon Redshift Serverless」が一般提供(GA)開始となったことを発表した。米国で2022年7月12日に、日本では7月13日に発表された。なおAmazon Redshift Serverlessは、2021年にプレビュー版としてリリースされていた。

 Amazon Redshift Serverlessは、東京リージョンを含む11リージョンで利用可能。データベースがアクティブなときに消費するコンピューティング容量に対してのみ、料金を支払う。プレビュー時から価格を見直し、米国東部(バージニア北部)リージョンの時間あたりの価格を0.5ドルから0.375ドルに下げ、ほかのリージョンの価格も平均25%下げている。

 GAを受け、Amazon Redshift Serverlessを含むAWSのデータ分析サービスについて紹介する記者説明会が7月13日に日本で開催された。

Amazon Redshift Serverlessの一般提供(GA)開始

サーバーレスなデータ分析サービス群にAmazon Redshiftが追加

 まず、アマゾン ウェブ サービス ジャパン合同会社の小林正人氏(技術統括本部 技術推進本部 本部長)が、AWSのデータ分析サービスについて説明した。

アマゾン ウェブ サービス ジャパン合同会社の小林正人氏(技術統括本部 技術推進本部 本部長)

モダナイズ、統合、革新をエンドツーエンドで支える

 小林氏はモダンデータストラテジーを構成する要素として「Modernize(モダナイズ)」「Unify(統合)」、「Innovate(革新)」の3つを挙げ、AWSはこうしたデータストラテジーを支えるサービスをエンドツーエンドで提供していると語った。

 モダナイズとしては、データを集めて活用するときに、AWSは運用負担の低いモダナイゼーションの仕組みを提供すると小林氏は説明した。リレーショナルデータベースや非リレーショナルなデータサービスなど、さまざまなサービスを提供して、事業の差別化につながらない運用をAWSにオフロードできるという。

 統合としては、洞察は気づく前にはどこに存在するかわからないという性質のものだから、一元化されたデータソースが必要だと小林氏は説明。そうしたデータの安全なアクセスや、各自が権限にもとづいて自分でデータを引き出せることなどにより、データのサイロ化を解消すると語った。そして、AWSではクラウド上のアナリティクスで豊富なサーバーレスの選択肢を提供していることを付け加えた。

 革新としては、大きなトピックとして機械学習・AIを小林氏は挙げた。幅広く、さまざまなレイヤーで機械学習・AIのサービスを提供している。

モダンデータストラテジーを構成する3要素
Modernize(モダナイズ)
Unify(統合)
Innovate(革新)

データ分析のサーバーレスなサービス群

 このモダナイズや統合の説明でも、「運用をオフロード」「サーバーレス」という言葉が出てきた。小林氏は、データ分析分野のAWSのサーバーレスなサービスを紹介した。大規模データ処理のAmazon EMRのサーバーレス版である「Amazon EMR Serverless」(6月GA)、Apache Kafka互換のリアルタイム処理のAmazon MSKのサーバーレス版である「Amazon MSK Serverless」(4月GA)、リアルタイム分析のAmazon Kinesisのサーバーレス版「Amazon Kinesis Data Streams On-Demand」だ。

Amazon EMR Serverless
Amazon MSK Serverless
Amazon Kinesis Data Streams On-Demand

 今回これに加わったのが、DWHサービスのAmazon Redshiftのサーバーレス版である「Amazon Redshift Serverless」である。

 ここで小林氏はAmazon Redshiftについてあらためて紹介した。Amazon Redshiftは2013年に登場し、速いスピードで進化を続けているという。

 氏は、最近のアップデートの例をいくつか挙げた。「RA3 node with マネージドストレージ」は、コンピューティングとストレージを分離して個別にスケール可能にしたものだ。また「Amazon Redshift Data Sharing」は、Redshiftクラスタ間でライブデータの一貫性のある共有を可能にするもので、部門ごとに独立して分析したいときに使うという。また、「Amazon Data Exchange for Amazon Redshift」は、第三者のデータを自社データと重ね合わせて分析するものだ。

 そのほか、機械学習により物理データ配置やその最適化を自動化する「自動化されたパフォーマンスチューニング」や、継続的なパフォーマンス改善、チューニングなしで高いパフォーマンスを出すコストパフォーマンスについて紹介した。

Amazon Redshift
RA3 node with マネージドストレージ
Amazon Redshift Data Sharing
Amazon Data Exchange for Amazon Redshift
自動化されたパフォーマンスチューニング
継続的なパフォーマンス改善:ショートクエリのスループット
継続的なパフォーマンス改善:チューニングなしでのコストパフォーマンス

DWH管理のスペシャリストがいなくても使えるAmazon Redshift Serverless

 Amazon Redshift Serverlessについては、米Amazon Web Servicesの川本雄人氏(Amazon Redshift プロダクトマネジメント ディレクター)が解説した。

米Amazon Web Servicesの川本雄人氏(Amazon Redshift プロダクトマネジメント ディレクター)

ユーザーの要望の変化に応える

 川本氏は、Amazon Redshiftは2013年からあるサービスで、現在数万の顧客が毎日エクサバイト級のデータを分析していると紹介した。

 その中で、さまざまなユーザーの要望も変わってきているという。DWH管理者の意向に沿ってしかデータ分析ができなかったのが、データサイエンティストや事業部門などさまざま人が利用するようになっている。そのため、DWH管理のスペシャリストでなくても、日々のメンテナンスなしに簡単に即座に使える環境の要望があると川本氏は語った。

 そのような声に応えたのが、Amazon Redshift Serverlessだ、と川本氏は説明した。これにより、数秒で分析作業を開始(データの取り込みから)できるという。

 Amazon Redshift Serverlessは、設定変更や管理作業の必要なしに使える。ノード数などの選択肢を考える必要がなく、キャパシティを自動的にプロビジョニングし、スケーリングする。使っていなければ料金は発生せず、使用した分だけ1秒単位で料金が発生する。

 従来のRedshiftの機能が利用可能。また、すでに利用しているBIツールがあれば、それらもRedshift Serverlessにつないで分析できるという。

 なお、従来のAmazon RedshiftからAmazon Redshiftへのデータ移行は容易で、Amazon Redshiftでスナップショットを取って、復元のときにAmazon Redshift Serverlessを選べるようになっていると、質疑応答において小林氏が説明した。

Amazon Redshift Serverlessの特徴
従来のRedshiftの機能が利用可能

 これにより従来のプロビジョンド型のAmazon Redshiftと、Amazon Redshift Serverlessの、2種類の選択肢が用意される。この2種類の使い分けについて川本氏は「きめ細かいカスタマイズや、厳しいSLAがあるときなどチューニングが必要なときには従来のRedshiftを、それがなくすぐに分析業務を行いたいときにはServerlessを」と説明した。

 川本氏はAmazon Redshift Serverlessのユースケースとして、セルフサービス分析や、アドホックな分析で小規模から始めて拡大するケース、データ量が予測不可能でスパイクのあるワークロードなどを挙げた。

従来のAmazon Redshiftと、Amazon Redshift Serverlessの選択肢
Amazon Redshift Serverlessのユースケース

Amazon Redshift Serverlessの既存事例

 Amazon Redshift Serverlessの海外での事例も紹介された。

 ヘルスケアのNextGen Healthcareは、プライバシーとセキュリティのために個別にDWHを提供する必要があり、管理に手間がかかっていた。そこで、Amazon Redshift Serverlessを使うことで、プラットフォームの管理が不要になった。

 イギリスの鉄道会社のRail Delivery Group(RDG)は、本業が鉄道なのでキャパシティなどの管理なしでデータ分析を行いたいという要望があった。そこでAmazon Redshift Serverlessを採用した。

 ビジネスコンサルティングのHuron Consulting Groupは、DWHの専門管理者がおらず兼任で管理していたのを、データ分析に集中したいということで、Amazon Redshift Serverlessを採用した。

Amazon Redshift Serverlessの事例:NextGen Healthcare
Amazon Redshift Serverlessの事例:Rail Delivery Group(RDG)
Amazon Redshift Serverlessの事例:Huron Consulting Group

AI・機械学習のサービスや事例、トピックも紹介

 最後に小林氏が、データ分析サービス全般に話を戻し、AI・機械学習関連のサービスをいくつか紹介した。

 機械学習の知識がない人向けのサービスとしては、顧客ごとのおすすめを容易に推薦できるサービス「Amazon Personalize」を小林氏は挙げた。

 続いてデータサイエンティスト向けとしては、機械学習モデルの開発などができる「Amazon SageMaker」を小林氏は挙げた。

 そのほか、Redshiftのデータから機械学習モデルの作成を実行できる「Amazon Redshift ML」も紹介された。

Amazon Personalize
Amazon SageMaker
Amazon Redshift ML

 AWSのAI・機械学習の国内事例としては、まずヤフー株式会社の例を小林氏は紹介した。刻々と変わるユーザー動向をアナリストが分析して、営業担当が活用するという要件だ。ただし、社内に構築すると、ローンチするまでに時間がかかると判断して、Amazon QuickSightを採用した。

 ソニーは、新型aiboでAIとロボティクス事業に再参入するにあたり、極秘の少人数のプロジェクトだったため、運用負荷が下げられるマネージドサービスとしてAWSのさまざまなサービスを採用した。

ヤフー株式会社の事例
ソニーの事例

 続いて、6月末にラスベガスで開催されたイベント「Amazon re:MARS 2022」で発表されたトピックについても小林氏は紹介した。

 まず、「Amazon CodeWhisperer」のプレビューを開始した。開発者が書いているコードやコメントを解析して、コードのオススメを出すというもので、GitHub Copilotに相当するサービスだ。

 また、「Amazon SageMaker Ground Truth」が合成データ生成に対応した。学習のためのデータについて、例えば画像に傷やへこみなどありがちな要素を追加したデータなどを生成するという。

Amazon CodeWhispererのプレビュー開始
Amazon SageMaker Ground Truthが合成データ生成に対応