特別企画
IBMのアナリティクスとクラウドはSparkとともに進化する
コグニティブとクラウドへのシフトが鮮明に
(2015/11/5 06:00)
SparkがIBMにとって重要な理由
クラウドへのシフトに苦しんできたIBMにとって、競合他社に負けないユニークな強みを持つことは、ビジネス上急務だった。同様にアナリティクスの分野でもハードウェアのパワーに頼る時代は終わり、スマートでインテリジェント、かつハイパフォーマンスなプラットフォームが求められるようになってきていた。
Sparkは、そうした意味でIBMにとってうってつけの技術だったといえる。IBMは今年6月以来、60以上のコントリビューションをSparkプロジェクトに対して行っている。同社の開発者3500名をSparkプロジェクトに割り当てたり、自社のマシンラーニングプラットフォーム「SystemML」をオープンソースとして公開するなど、全面的にSparkプロジェクトを支援してきた。同社が設立した「IBM Spark Technology Center」にはApache Sparkの技術者35名が雇用されており、無料オンライン教育コースの「BigDataUniversity.com」では、世界中で31万名のデータプロフェッショナルがSparkによるトレーニングを受けているという。これらのSparkへの投資額は約3億ドルに上る。
「Sparkがここ1、2年で急速に成長したのには理由がある。エコシステムが確立していること、アルゴリズムが洗練されていること、特にマシンラーニングに向いている、さらにScalaで実装されているのでJavaやPythonといったメジャーな開発言語と相性がいい」(IBM アナリティクス部門 プロダクト開発担当バイスプレジデント ロブ・トーマス氏)。
Sparkは、同じ分散処理システムのHadoopとは互いに補完しあう関係にあるが、Hadoopに比べて後発プロダクトのSparkは、クラウドへの実装やUIの洗練性という点でHadoopよりも早く成長した。また、コグニティブコンピューティングを擁するIBMにとってマシンラーニングに強く、インタラクティブな処理を得意とするSparkの特性は、クラウド市場での優位性を確立できていないIBMにとって大きな訴求ポイントになる。
さらに、IBMは過去にLinuxやJavaなどの開発を支援してきた歴史をもつが、これまでその貢献が大きく注目される機会は多くなかった。クラウドやビッグデータアナリティクスを支える技術の多くがオープンソースプロダクトである以上、オープンソースへのコミットメント評価はビジネスに直結する。Sparkがまだオープンソースプロダクトとしての歴史が浅い点も、IBMが肩入れする理由のひとつになるだろう。こうして見ていくと、IBMがこれからクラウドとアナリティクスの分野で同時にユニークなエコシステムを構築するためにはSparkは欠かせないパーツだったということになる。
Insight 2015のSparkキーノートに登壇したIBMフェローでデータアナリティクスのスペシャリストであるジェフ・ジョナス氏は、アナリティクスシステムのあるべき姿として「データは新たなデータを見つけてくると、さまざまな関係性が明らかになっていく。そしてその関係性がよりクリアになってくると、今度はその関連付けられた結果のほうからあなたを見つけ出してくれるようになる」と語っている。データからインサイトを見つけ出す時代から、データのほうからユーザーに近づいてくる時代になったとき、IBMはそこで存在感を示すことができているのか、Sparkのこれからの成長はその答えのカギとなるだろう。