イベント
データドリブンアナリティクスのカギはデータ統合とSQL (Teradata Loom)
「Teradata 2014 PARTNERS」基調講演レポート
(2014/10/22 10:45)
Teradata Loom - 濁ったデータレイクからクリアな分析を得る
PARTNERS 2014の前に発表された「Teradata Loom」も今回の大きなトピックのひとつだ。TeradataはHadoopディストリビュータのHortonworksおよびClouderaとパートナーシップを提携しているが、「Apache Hadoop」「Hortonworks Data Platform」「Cloudera Distribution including Apache Hadoop」といったHadoop上にあるデータのナビゲートを容易かつ迅速に行える手段を提供するソフトウェアだ。
Teradataユーザーのためのエンタープライズパッケージである「Teradata Loom」のほかに、Teradataユーザーでなくても無償で利用できる「Teradata Loom Community Edition」がある。
Hadoopの普及が進めば、企業は大量の生データにアクセスすることになる。スキーマのない生データの膨大な塊は、ある意味、非常に危険な存在でもある。データの品質やセキュリティに加え、データマネジメントも重要な課題となって襲ってくる。分析しようにもその前処理に時間がかかりすぎ、求めるパフォーマンスも精度も得られない可能性は高い。
LoomはそうしたHadoopデータをメタデータも含めて扱いやすくするために開発されたプロダクトだと言える。最近、Hadoopデータの塊を“データレイク”と呼んでいる向きがあるが、たしか膨大な水量をたたえた湖のようなHadoopデータから高い品質のアナリティクス結果を迅速に得るのは至難の業だ。
Loomは慣れないHadoopデータの扱いにとまどうユーザーのために、Webブラウザという使い慣れたインターフェイスでもってHadoopデータを処理するさまざまな機能を提供する。例えばHadoop上の経路の把握、メタデータの統合、整形/加工などのデータラングリングなどが、簡単に速く、しかもセキュアに行うことが可能になる。
「Loomがリーチするのはテクノロジユーザーよりもビジネスユーザーだ。彼らにはHadoopの煩雑な操作で悩んでほしくない。データドリブンによるイノベーションを生み出すことにより近い方法を選ぶためにも、Loomでもって洗練されたアナリティクスを実現する機会を提供したい」と、コーラーCEOのあとに登壇したTeradata Labのプレジデントであるスコット・ナウ(Scott Gnau)氏は強調している。
濁った湖の底に沈んだひとつの小石をピンポイントで拾い出すかのように、求める結果にダイレクトにリーチする - データドリブンアナリティクスの効率化を図るツールとして期待される。
なお、Loomは「Hortonworks Sandbox」「Cloudera QuickStart VM」とのプリパッケージ版も提供される(無償版も含む)。