ニュース

Pivotal、Hadoop 2.2ベースの最新ディストロ「Pivotal HD 2.0」

インメモリ処理エンジン「GemFire XD」を統合

 Pivotalジャパン株式会社(以下、Pivotal)は2日、企業向けHadoopディストリビューションの新版「Pivotal HD 2.0」と、「Pivotal HD 2.0」上で低レイテンシでのSQL処理を実現するインメモリ処理エンジン「Pivotal GemFire XD」を販売開始すると発表した。

 「Pivotal HD」は、オープンソースのApache Hadoopをベースに開発された商用Hadoopディストリビューション。Apache Hadoop 2.2をベースにしたPivotal HD 2.0では、SQL on Hadoop機能を提供する「HAWQ(ホーク)」の分析機能を強化したほか、インメモリ処理エンジンの「Pivotal GemFire XD」を統合している。これにより、ビッグデータ分析とリアルタイムでのファストデータ分析の両方を、単一のHadoopプラットフォームで実現可能になったという。

 具体的には、Hadoop 2.2の採用により、HDFSの高可用性、スナップショット、フェデレーション、NFS v3インターフェイスといった最新機能を利用可能。また、YARN、Pig、Hive、HCatalog、HBase、Mahout、ZooKeeper、Flume、Sqoop、Oozieといったモジュールをサポートした。

 また、ファストデータ用インメモリ処理エンジンのPivotal GemFire XDは、OLTPデータストア/インメモリデータベース「Pivotal GemFire/SQLFire」の製品開発の中で培ってきた、ファストデータ処理のためのインメモリ技術を結集させたもの。ユーザーは、Pivotal GemFire XDにより、さまざまなシステムやデバイスが生成する大量データをリアルタイムに収集し、インメモリ技術の活用により低レイテンシで分析業務を実施できる。さらに、バッチ処理などの後工程が必要なデータはHadoop環境に直接蓄積するといった、ビッグデータやファストデータを包括的に活用する環境を実装可能とした。

 HAWQでは、今回の分析機能の強化により、オープンソースの数理分析ライブラリ「MADLib」に含まれるアルゴリズムを広範にサポート。また、PL/R、PL/Java、PL/Pythonを使用し、ユーザー定義関数(UDF)として利用することで、In-Database分析も可能になる。Pivotalによれば、こうしたHAWQの分析機能強化により、分析アプリケーションに含まれるSQL資産や既存保有スキルを、大規模並列分散処理のHadoop基盤に対しても容易に適用できるようになったとのこと。

 なおPivotal HD 2.0の参考価格は、年間サブスクリプション形式の場合、年間27万2250円(税別)。また、有償オプションとして提供されるPivotal GemFire XDが年間97万9000円(税別)、HAWQが年間74万9100円(税別)。

石井 一志