「SQL Server+Hadoopがビッグデータ活用の基盤になる」~米Microsoft バイス氏
Microsoftでは、間もなくSQL Serverの最新バージョンであるSQL Server 2012を発売する予定だが、ニーズが広がりつつある“ビッグデータ”活用という領域に対して、同社はどういった取り組みを考えているのだろうか。
来日したデータベースシステムグループ プログラムマネジメント部門 ゼネラルマネージャーのショーン・バイス氏に、SQL Server 2012とビッグデータ活用に関する取り組みを聞いた。
■3つの領域にフォーカスして開発されたSQL Server 2012
――SQL Server 2008 R2では、新機能はかなりBIにフォーカスされていました。では、SQL Server 2012での注力エリアはどこでしょうか?
米Microsoft データベースシステムグループ プログラムマネジメント部門 ゼネラルマネージャーのショーン・バイス氏 |
バイス氏:SQL Server 2012では3つのエリアに注力しています。1つ目は、ミッションクリティカルを託せる信頼性です。当社では高可用性と災害復旧に投資をし、Always On機能を搭載しました。
また、PowerPivotを拡張したPower Viewを新たに搭載しているように、今まで行ってきた投資に引き続き、BIにも注力しています。Power Viewでは、今までにない形でデータの可視性を達成しており、データに対する洞察を高めていけます。これによって、多くの意思決定が可能になるでしょう。
3つ目としては、アプライアンスからクラウドまでの単一アーキテクチャである、ということが挙げられるでしょう。
■ビッグデータ活用のためにHadoopに取り組む
――まだ、その活用法が固まったとはいえない状況ですが、いわゆる“ビッグデータ”への注目が高まっています。これについて、SQL Serverではどう対応していくのでしょうか。
バイス氏:構造化データ、非構造化データの双方が非常に増加していますが、それらが組み合わさって使われるようになっていますが、ビッグデータとして考えた時には、非構造化データのボリュームが非常に多くなってきていますね。
センサー、デバイス、電話、GPSなどのソースがあって、データのボリュームはPBクラスになる。それだけの量があれば、データタイプとしてもさまざまあるでしょうし、それらが入ってくるスピードも速い。ボリュームについてもバラエティに富んでいます。これらをお客さまがいかに管理していくか、それをお手伝いできるようにしないといけません。
そのためにはHadoopが使えます。SQL Serverがこれをフォローすることは自然だと考えていますから、SQL ServerとWindowsによって活用を支援していきます。
――しかし、ビッグデータに対処するためにRDBMSは不向きだという意見もありますね。
バイス氏:確かに、そういった限界はあります。
構造化データの世界では、さまざまなトランザクションの一貫性を維持するかが重要でそこに注力しています。しかし非構造化データでは、発生と同時にいかに早くとらえることができるかが重要で、最終的には、それらの一貫性、可用性を高めようということではありますが、従来型のRDBMSでできることではないため、当社ではHadoopディストリビューションを提供しようとしています。
つまり、Hadoopなどを当社のエコシステムの中に取り込み、両面の手法で対応しようとしているわけです。同じモノで実現するのではなく、2つの世界の橋渡しをしようとしています。
具体的には、Windows Azureでのプレビューを予定していますし、それをSQL Serverへと展開していくことになります。
――最近では、NoSQLもさまざまな製品が提供されるようになり、これを活用する動きも広がっています。MicrosoftがNoSQLを製品に取り込む可能性はないのでしょうか?
バイス氏:今のところは、Hadoopに一番力を入れています。エコシステムとしては大きなものですし、NoSQL製品が急速に進化していることは認識していますが、今、当社としては、最高のMicrosoftのHadoopディストリビューションを提供することに力を入れているのです。
■ビッグデータの使い道は?
――ビッグデータの分析は、具体的にはどの分野に適用していけるのでしょう。
バイス氏:多くの業種向けのシナリオがあるでしょう。例えばリテール向けであれば、お客さまの好みをビッグデータとして集められますので、同じサイトで買い物をしようとした時は、商品の中からリコメンドできます。
また政治では、ある候補の応援サイトを訪問した時に、人々の指向によって彼らに適したデータを見せたり、広告を見せたりできるようになります。つまり、人々の関心を絞った上でメッセージを見せられるわけですね。
製造業では、製造システムやディーラーなどからデータを集めるだけでなく、Facebookのようなソーシャルデータを集めたりすることも考えられます。
すでに当社では、SQL Server 2008 R2 Parallel Data Warehouseのように、こうしたビッグデータを扱うためのソリューションはいくつか提供していますし、FacebookやTwitterからのフィードをアプリケーションに取り込むようなものも、Windows Azureのマーケットプレースではいくつか見られますよ。