ビッグデータではなく“オールデータ”をどこよりも高速分析する強み~Teradata・コーラーCEO
10月21日から25日の5日間にわたり、米国ワシントンDCにおいて開催されたTeradataの年次ユーザーカンファレンス「The 2012 Teradata PARTNERS User Group Conference&Expo(以下、PARTNERS 2012)」。今年で27回目となるPARTNERSは55カ国から3800名を超える過去最高の参加者を集め、5周年にふさわしい規模のイベントとなった。
今回のPARTNERS 2012においてTeradataがテーマに掲げていたのは、「ビッグデータ分析」と「マーケティング」である。買収したAster Data、eCircle、Aprimoといったポートフォリオの統合をようやく終え、PARTNERS 2012を境に今後はその成果を市場に問うことになる。
中でも注目されるのは、非構造化データをSQLから扱うことを可能にするAster Dataとの連携だ。PARTNERS 2012開催の少し前、TeradataはMapReduceとSQLをともにサポートする分析アプライアンス「Teradata Aster Big Analytics Appliance」を発表した。構造化/非構造化データを問わず、HadoopとAster Dataを融合させることで高速かつ精度の高い分析を実現できるというのが最大のポイントで、データウェアハウジングに特化してきたTeradataならではのビッグデータ製品とも言える。
今回、PARTNERS 2012の会場において、Teradataを率いるマイク・コーラーCEOにビッグデータを中心とする同社の戦略を伺う機会を得たので、その内容をお伝えしたい。
■独立から5年、データ分析とマーケティングに特化し大きな成長
マイク・コーラーCEO |
――今回のPARTNERSは独立してから5周年という節目の中で行われたわけですが、まずはこの5年間を簡単に総括していただけるでしょうか。
コーラー氏:
この5年間でTeradataは非常に大きな成長を遂げることができました。顧客の数も従業員の数も大幅に増え、各方面からの期待に十分応えられたと思っています。NCRから独立したことでTeradataのことだけを考えたビジネスを遂行できたのも大きい。例えば2008年、2009年と世界的な不況が続きましたが、独立していたからこそ新技術への投資や買収を進めることができました。だからこそ現在の成功につながっているのです。
――Aster Dataをはじめ、Teradataの買収戦略は非常にうまくいっているように思えます。企業買収におけるガイドラインがあればお伺いしたいのですが。
コーラー氏:
ひとつ前置きしておきたいのは、われわれは新しい技術に対応するとき、3つの方向性から検討しているという点です。自社で開発するか、技術をもっている企業を買収するか、あるいはパートナーとして提携するか。ケースに応じて最善の道をこの3つから常に選ぶようにしています。Aster DataやAprimoの場合、われわれの既存の製品ラインアップに組み込みやすい技術であることから、買収したほうが得策だと判断しました。
――今年5月には、デジタルマーケティングビジネスを展開するドイツのeCircleを買収されています。
コーラー氏:
eCircleはマルチチャネルのデジタルメッセージングソリューションを提供しており、クラウドベースのマーケティングビジネスを展開するAprimoをうまく補完する役目を果たします。ビッグデータの45%はマーケティングに利用されているという統計もありますが、ビッグデータ分析はすでにマーケティングの世界を大きく変えつつあります。
既存のEDWやAster Dataによるビッグデータ分析で得たインサイトをデジタルマーケティングに生かすことが可能になり、ビッグデータ分析とマーケティングを中心とするわれわれのエコシステムがひとつの完成形を見せた格好になります。
――つまり、SQLによる構造化データ分析を得意としてきた従来からのデータウェアハウジングに加え、Aster Dataを取り込んだことで非構造化データの高速分析も可能になり、そこで得た分析結果をAprimoやeCircleでマルチチャネルのマーケティング手段として提供するというわけですね。
コーラー氏:
その通りです。Teradataはビッグデータからアナリティクスとマーケティングで価値を引き出す。ビッグデータと言うよりはすべてのデータ、オールデータと呼んだほうがいいかもしれません。
■HadoopとSQLを融合するAsterの新アプライアンス
PARTNERS 2012の展示会場に設置されていたAsterの新アプライアンス |
――今回のPARTNERSの目玉でもあったAsterの分析アプライアンスについてもう少しお聞かせください。このアプライアンスではAster Dataの独自技術であるAster SQL-HとAster SQL-MapReduceにより、SQLインターフェイスによるHadoopへのアクセスを可能にしていると伺っています。
コーラー氏:
ソーシャルやモバイルの普及でビッグデータと呼ばれる非構造化データは急激に増え、そうした大量で多様なデータを扱うのにHadoopが効果的なソリューションであることはすでに実証済みです。ただしHadoopがすぐれているのはデータを収集し、ストアするという点においてです。高い精度で高速に分析するという作業はHadoopの得意分野ではないのです。Hadoopに分析をやらせるのはコストもかかるし、エンジニアリングリソースの無駄遣いともいえます。
Hadoopから吸い上げた非構造化データをSQL-Hを経由してAsterのアプライアンスに取り込み、SQLインターフェイスで高速に分析する。われわれはこのアプライアンスを“ディスカバリプラットフォーム”と呼んでいます。膨大な非構造化データから、Hadoopプログラマー以外のデータサイエンティストやデータアナリストがインサイトを確実に見つけ出すことができるからです。
すでにSQL-MapReduce上で動く分析アプリケーションは50以上開発されており、構造化データの分析を得意とする既存のTeradataのDWHと組み合わせれば、まさしくオールデータの分析環境が実現するわけです。
――Hadoopプログラマーでなくとも非構造化データから直接分析できるというのは大きな魅力に感じます。
コーラー氏:
Hadoopの技術に習熟した優秀なエンジニアはGoogleやYahoo!などに固まっており、世界的に見てもそれほど多く存在しません。そのギャップを埋めるべく、ビジネスアナリストや計量アナリストでも分析できるよう開発したのがこのアプライアンスです。Aster Dataはもともと非構造化データをSQLから操作することを得意としていた企業です。その技術力が今回ようやく、Teradataのポートフォリオに組み込まれたわけです。
AsterはHadoopとSQLをつなぐディスカバリプラットフォーム |
――新アプライアンスではHadoopディストリビューションとしてHortonworksを選んでいます。その理由を教えてください。
コーラー氏:
われわれの見るところ、Hortonworksは業界内で唯一、Apache Hadoopと100%互換を果たしているディストリビューションです。また、HortonworksはYahoo!からスピンアウトした企業で、スタッフのほとんどがYahoo!でオープンソースのHadoop開発にかかわっており、現在も積極的に貢献しています。おそらくApache Hadoopの知的財産のうち8割はHortonworks由来ではないでしょうか。われわれとしてはできる限りオープンなディストリビューションを採用したかったので、Hortonworksを選んだのはごく自然な成り行きだといえます。
■OLAPとOLTPは両立しない~Teradataは高速分析だけを追求する
――ここ最近、Oracle ExadataやSAP HANAなど、いわゆる“インメモリ”ですべてのデータを処理しようという流れが強くなっているように思えます。こうしたトレンドを、Teradataはどのように見ているのでしょうか。
コーラー氏:
先ほども申し上げた通り、われわれはオールデータを分析対象にしていますが、あるひとつのストレージや媒体にすべてのデータを詰め込むのはソリューションとして疑問に感じます。
お客さまはデータによってさまざまなストレージや媒体を選べるほうがいいはずで、頻繁にアクセスされるホットなデータはメモリに、ほとんどアクセスされることのないコールドなデータは安いストレージに、といった使い分けをすべきでしょう。
Teradataはデータの“温度”によって格納場所を自動で振り分けるソリューションとして「Teradata Virtual Storage」を提供しています。異なるタイプのディスクやストレージが混在しているのがお客さまの現実的な環境であり、データの温度に応じて自動で最適な配置を行うことができます。めったにアクセスされないデータを高価なインメモリで扱うのは、非常にもったいないと思いませんか?
インメモリはたしかに面白い技術ですし、Teradataも今回、QlikTek、Alteryxといったアプリケーションベンダと協業し、インメモリ分析ソリューションを発表しています。ですが、すべてのデータをインメモリで分析、という考え方には賛同できません。
また、近い将来、インメモリより速い技術は必ず出てくるはずで、もう少し動向を見守る必要があると思っています。
――インメモリデータベースを推進しているほかのベンダの中には、OLTPとOLAPをひとつのデータベースプラットフォーム上で実現できると強調しているところもあります。データウェアハウジングとトランザクションをひとつのプラットフォームで実現するというものですが、DWH専業ベンダとして、こうした流れをどうご覧になっていますか。
コーラー氏:
競合他社が言っている“OLTPとOLAPをひとつにする”は、単にひとつの筐体内に処理を押し込んでいるだけで、決してOLAPに最適化されているわけではありません。
もっとはっきり言えば、彼らのソリューションはOLTP用にチューニングされたものであり、OLAPで同等の速さが出るとは思えません。OLTPとOLAPは処理のプロセスがまったく異なるので、どちらかに最適化しなければ高速な環境は実現しないのです。無理やり一緒にしようと思えばできなくはありませんが、やる意味を見いだせない。
あまり大っぴらにしていませんが、「すべてをTeradataで処理したいからOLTP環境も用意してほしい」というお客さまの要望をごくたまに受けることがあります。できなくはありませんがTeradataのOLTPは決して速くないことをあらかじめお伝えして、それでもいいという場合のみ、対応することもあります。
でも、われわれは基本的にはOLTPはやりません。OLAPだけ、分析だけです。他社がどんなに「OLTPもOLAPも可能」と言っても、速くできなければ意味がありませんから。最速で最高のデータ分析ソリューションを届け、お客さまもビジネスを成功に導くことがわれわれの使命ですから。
――5年間、順調にビジネスを展開できたのもTeradata自身がTeradataで分析を行ってきたから、ということでしょうか。
コーラー氏:
たしかにわれわれもTeradata製品を使って分析をしています(笑)。ですが、われわれの製品はわれわれのような会社よりも、トランザクションデータをたくさんもっている企業でこそ真価を発揮します。膨大なトランザクションデータがあるからこそ、データ分析の価値と速さが生きるのですから。
――日本にはそうした膨大なデータを抱えたまま、分析に活用できない企業がたくさん存在します。
コーラー氏:
私は日本は非常に大きな可能性のある市場だと見ています。成長率の高い国よりも、日本のようにもともとのGDPが大きいからこそ、レガシーがたくさん存在する。日本企業がそうしたレガシーから脱する支援をわれわれのソリューションで支援していければと思います。