ニュース
米Cloudera、SQL-on-Hadoopを実現するクエリエンジン「Cloudera Impala」を一般公開
(2013/5/2 13:00)
米Clouderaは4月30日(米国時間)、Hadoopクラスタに格納されたデータをリアルタイムに分析できる、オープンソースのクエリエンジン「Cloudera Impala」を一般公開した。
Impalaは、HDFSおよびHBaseに格納されたデータに対し、直接クエリをかけられるクエリエンジン。リアルタイムにデータを問い合わせることができるほか、Apache Hiveと同じメタデータ、SQL文法(HiveQL)、ODBCドライバとユーザーインターフェイス(Hue Beeswax)を利用し、バッチ指向とリアルタイムクエリの間で、統一されたプラットフォームを提供するという。
Impalaフレームワークは、標準的なファイルやデータフォーマットをサポートしているため、ユーザーはユースケースに最適なフォーマットを選択可能。例えばParquetのような、最新の分析に特化したカラムフォーマットに対応するほか、バッチからインタラクティブSQLまで、すべての単一データセットからの全コンピューティングワークロードにまたがったデータの共有・再利用も促進するとのこと。