イベント
AWS日本法人の長崎社長が多様なクラウドの使い方を紹介、Redshiftの実機評価結果も
~AWS Summit Tokyo 2013 2日目レポート
(2013/6/7 06:00)
Amazon.comのクラウドサービスを提供するAmazon Web Services(AWS)のカンファレンスイベント「AWS Summit Tokyo 2013」が6月5日から6日まで開催された。最終的な登録者数が9429人と、カンファレンスや展示に大勢の人が集まった。
企業がAWSを利用する6つのパターン
2日目の基調講演では、AWSの日本法人であるアマゾンデータサービスジャパン 代表取締役社長の長崎忠雄氏が壇上に上がった。
長崎氏は、Amazon.comのCTOのWerner Vogels氏による初日の基調講演と共通して、AWSの考え方や現状、各サービスなどを次々に説明した。特に、多彩なビルディングブロック(パーツとしてのサービス)により、幅広い用途に対応できると語った。
また、パブリッククラウドとオンプレミスとの関係として、「二者択一ではない。既存資産を生かせる」と述べ、オンプレミスとAWSとを接続するサービスについても説明した。そのうえで、AWSの顧客が実際にクラウドをどのように利用しているか、6パターンに分けて紹介した。
1つ目が、開発、検証環境としてAWSを利用する、古典的ともいえる利用方法だ。これについては、業務アプリケーションの開発やテストにAWSを使ったアンリツと東証の事例や、ERPパッケージの開発テストにAWSを使ったワークスアプリケーションズの事例が紹介された。
2つ目は、新しいアプリケーションをクラウドで動かす利用方法。これについては、店舗の端末をiPadにして新しい業務アプリを構築したガリバーや、東芝のレグザクラウド、日テレのJoinTV、オンライン広告のリアルタイム入札を実現するDSP(Demand Side Platform)のフリークアウトの事例などが紹介された。
3つ目は、オンプレミスで動いている既存アプリをクラウドを使ってより良くする利用方法。これについては、繁忙期にリソースをAWSから調達するようにした九州大学や、原価計算のためにAWS上のHadoopを使って処理時間とコストを削減したアンデルセン、バックアップにAWSを使うファンコミュニケーションズの事例が紹介された。
4つ目は、クラウドと既存のオンプレミスアプリケーションを統合する利用方法。これについては、音楽配信の課金はオンプレミスに置き配信プラットフォームをAWSに置いたレーベルゲートの事例などが紹介された。
5つ目は、既存のアプリをクラウドに移行する利用方法。これについては、基幹システムをすべてAWSに移行した にしてつストアや、SAPシステムを皮切りに業務システムをAWSに移行している協和発酵キリン、ERPなどインフラの定期的なリプレースを避けるために自前でAWSに移行したタイテックの事例が紹介された。
6つ目は、クラウドにとっての最終形ともいえる、すべてをクラウドで動かす利用方法だ。これについては、Web系からBI系、受注などの業務システムまでAWS上で動かしている あきんどスシローの事例や、「聖域を設けない」というポリシーでECサイトからPOS、会計や人事などの業務システムまでAWSで動かしている東急ハンズの事例、SaaSやパッケージアプリケーションをAWSで動かしているミサワホームの事例が紹介された。
基調講演の中では、東京海上日動、三井物産、SAPジャパン、日立という、エンタープライズ色の強い企業がそれぞれゲストとして壇上に立ち、クラウドやAWSに対する期待を語った。
Redshiftの性能評価結果を紹介
2日目も、基調講演の後は個別のセッションが開かれた。「Amazon Redshiftが切り開くクラウド・データウェアハウス」と題したセッションでは、5日に東京リージョンでの提供も開始されたAWS上のデータウェアハウス(DWH)サービス「Amazon Redshift」について解説。さらに、野村総研(NRI)による実機評価結果も紹介された。
まず、アマゾンデータサービスジャパン ソリューションアーキテクトの八木橋徹平氏が、Amazon Redshiftの概要を紹介した。八木橋氏は、オンプレミスのDWHについて、初期投資や運用管理のコストのほか、何年か先のデータ量を見越してシステムを組まなくてはならないという課題を指摘。Amazon Redshiftは、こうした問題を回避できると語った。
また、オンライン処理向きのRDSやDynamoDBに対して、RedshiftやElastic MapReduce(EMR)を分析向きとして位置づけ、その中でSQLを使うのがEMRとの最大の違いだと説明した。さらに構成例として、RDSなどからS3に蓄積してRedshiftで読み込む方法や、RDSからEMRをETLに使ってRedshiftで読み込む方法などが紹介された。
Redshiftはカラムナ(列指向)型データベースで、ノード数を増やしてスケールさせられるクラスタ構成をとる。八木橋氏は、クエリー、ロード、バックアップ・リストア、リサイズについて概要を紹介。さらに、料金体系を紹介した
ここで、Amazon Redshiftが限定公開のときから先行評価に参加した野村総研(NRI)が、評価データなどについて解説した。
まず性能について、「ほかのDWH製品と比較した数字は出せない」と前置きをしつつ、巨大テーブルでの検索の検索やロード、小さな(1.2億件)テーブルの検索の検証結果を示し、「かなり速い。また、きれいにスケールしている」とコメントした。
また、チューニングのポイントとして「一番効果があるのは、分散先のノードを決めるDistribution Keyのチューニング。RDBMSのインデックスのようなもの」とノウハウを紹介。実際にDistribution Keyを指定しない場合と指定した場合とで大きく性能が変わるデータを示した。
注意点としては、データ形式に得意不得意があり、「あるデータだけ非常に時間がかかった」という例を報告。その場合には、そのデータをEMRでカバーするという方法を紹介した。
最後に八木橋氏が、Amazon Redshift周辺のエコシステムを紹介した。まず、オンプレミスのデータを持っていく製品としては、インフォテリアのEAI製品「Asteria Warp」がRedshiftの正式サポートを発表したことを紹介した。また、BIツールとしては、KSKアナリティクスが販売する「Pentaho」と、ワークブレイン・ジャパンが販売する「Jaspersoft」がRedshiftを正式サポートとしたことを紹介した。