イベント

データドリブンアナリティクスのカギはデータ統合とSQL

「Teradata 2014 PARTNERS」基調講演レポート

 ここ1、2年、エンタープライズITの世界では「データドリブン(data driven)」というフレーズを聞く機会が増えてきた。特にアナリティクスと組み合わせて「データドリブンアナリティクス」という表現で使われることが多い。これは単なる「ビッグデータ分析」と何が違うのだろうか。

 10月19日~23日(米国時間)の5日間にわたって米国ナッシュビルで開催された、Teradataの年次プライベートカンファレンス「Teradata 2014 PARTNERS Conference & Expo(以下、PARTNERS 2014)」では、まさしく“DATA DRIVEN”がイベントのテーマとして掲げられていた。

 本稿では20日に行われたオープニングキーノートで発表された製品紹介をベースに、データドリブンアナリティクスに対するTeradataのアプローチを検証する。

Teradata QueryGrid - ワンストップでOracle DBと統合も!

Teradataは今回のPARTNERS 2014にあわせ、いくつかの大きな発表を行っている。

・Teradataと他のデータソースをシームレスに統合する「Teradata QueryGrid」
・Hadoop内のデータおよびメタデータの処理を扱いやすくする「Teradata Loom」
・Clouderaとのパートナーシップ強化
・インメモリ技術「Teradata Intelligent Memory」の機能強化
・マーケティング用のクラウドソリューション「Teradata Integrated Marketing Cloud」への新機能追加およびパートナーエコシステムの強化
・ソーシャル上などでのつながりやデータどうしの連携を分析する「Connection Analytics」(Teradata Asterにビルトインされる機能)
・グローバルコンサルティングサービスの強化

 このうち、最も注目したいのが「Teradata QueryGrid」だ。ユーザーはQueryGridによって連携された複数のデータソースに対し、Teradata DatabaseもしくはAsterからクエリを投げることで、データソースの場所を気にすることなく迅速に分析結果を得ることができる。データの処理は“そのデータがある場所で可能な限り行う”というプッシュダウン方式を採用しており、データの移動と重複を最小限に抑えている。

 QueryGridではTeradata以外のデータソースにも対応していることが大きなポイントだ。すでにOracle Database用のコネクタは提供が開始されており、ほかにもHadoopやMongoDBといったオープンソース系のデータソースにも対応している。

 TeradataとOracle、TeradataとHadoopを1つのクエリでシームレスに連携させることができれば、ユーザーはもう自分の手でデータを移動させる必要も分析を別々のプロセスに分ける必要もない。データソースが新たに追加された場合でも、データの存在場所を気にすることなく分析に集中できる。

 データサイエンティストやマーケティングアナリストはもちろんのこと、SQL SELECT文を自分で書けるスキルをもつビジネスユーザーにとってもメリットが大きい機能だと言える。

 データソース間はファブリック接続で統合される。Teradataからベストオブブリードとして「Teradata - Teradata Capability」「Teradata - Aster Capability」「Adaptive Optimizer Capability」の3つがビルトインとして提供される。OracleやMongoDBなどサードパーティへの接続はAdaptive Optimizerに含まれる。今後はCassandraなどのオープンソース系プラットフォームの対応が強化される予定だ。

QueryGridでは、複数のファイルシステムやアナリティクスエンジン、データタイプを集約し、グリッドライクなシステムを構築する。CPUセントリックやディザスタリカバリといった属性をファブリックに付加することも可能。ビジネスユーザはワンストップでダイレクトにクエリをかけることができる
Teradata CEOのマイク・コーラー氏

 オープニングキーノートに登壇したTeradata CEOのマイク・コーラー(Mike Koehler)氏は「データが孤立し、サイロ化された環境でアナリティクスを行っても仕方ない。データは統合された環境で利用することではじめて価値あるアナリティクスを提供することができる。複数のデータソースをワンストップで束ねるQueryGridは、データドリブンアナリティクスを促進する存在」と語っている。

 より多くのデータソース、より簡単なアプローチ、より速いリーチ--。これらはいわばデータドリブンの必要条件であり、これを満たすツールがQueryGridということになる。

(五味 明子)