イベント

フルマネージド中心のラインアップが開発者に生産性を与えていく――、ボーガスCTOから「AWS re:Invent 2016」参加者へのメッセージ

AWS re:Invent 2016キーノート

データインジェストからアナリティクス、通知まで一気通貫に

 「クラウドが成し遂げた偉大な功績は誰もにテクノロジパワーを提供し、データを民主化したことだ」――。ボーガスCTOはこう前置きし、Amazon RedshiftやAmazon EMRの登場で誰もがクラウド上でビッグデータを扱えるようになった実績をあらためて強調する。

 続けて、前日にジャシーCEOが発表したAmazon Athenaについて触れたのち、新しいかたちのデータアナリティクスサービスである「Amazon Pinpoint」を発表している。

 Pinpointはその名の通り、特定のモバイルユーザーをピンポイントにターゲティングし、彼らに対してプッシュ通知を送信するマネージドサービスである。

 「ユーザーの行動を理解し、エンゲージ(ターゲット)すべきユーザーを選び、プッシュ通知を送信する。これでキャンペーンの結果をトラックすることが可能になる」とボーガスCTOはPinpointが単なるプッシュ通知サービスではなく、ユーザーエンゲージメントを高めるためのアナリティクスサービスであると強調する。

 「EMRやRedshift、それに今回リリースされたAmazon AIやAthenaなどを含め、データアナリティクスにまつわるサービスが一気通貫で揃った」というボーガスCTOだが、前述のデベロップメントと同様、データ分野でもミッシングピースを埋めるというAWSの戦略が見て取れる。

ターゲティングしたユーザーだけのふるまいをキャッチして通知する「Amazon PinPoint」

 ボーガスCTOが2つめのデータ関連サービスとして発表したのが「AWS Glue」だ。データカタログとETLに特化したフルマネージドサービスで、S3、RDS(データベース)、Redshiftのほか、外部のデータベースであってもJDBCドライバで接続できれば利用可能だ。

 「データアナリティクスに関する作業の80%は、分析とは直接関係のない作業」とボーガス氏はアナリティクスの現状を語り、アナリティクスにかける時間が80%になるよう、データの前処理の負荷を軽くするのがGlueの役割だという。

 分散するデータを糊(glue)のようにつなぎ合わせ、統合し、カタログを作成することで、RedshiftやEMRといったアナリティクスサービスの精度もパフォーマンスも高まる効果が期待される。

分散するデータソースをのりのように統合する「AWS Glue」はデータの前処理に悩むデータサイエンティストにも向いている

 そして3つめのデータ関連サービスのアップデートが「AWS Batch」、プレビュー版での提供ではあるが、名前の通り、バッチ処理の実行をフルマネージドで行うサービスである。AWSらしく、必要なリソースやボリュームに応じてスケールし、場合によってはスポットインスタンスの適用も可能となっている。現在、Lambdaのファンクション時間は5分だが、それを超える時間のプロセス処理にも向いているとされる。

文字通りバッチプロセスをスケーラブルに実行する「AWS Batch」