ニュース

米Cloudera、CDH5とCloudera Enterprise 5を発表

 米Clouderaは29日(米国時間)、エンタープライズ向けのHadoopディストリビューションの新版「Cloudera's Distribution Including Apache Hadoop(CDH) 5」、および、「CDH」にサポートサービス・管理ツールなどをセットにしたパッケージの新版「Cloudera Enterprise 5」を発表した。現在、パブリックベータ版が利用可能という。

 これらの製品・ソリューションでは、Apache Hadoop 2により、大規模の構造化・非構造化データセットにおいて、蓄積・処理・分析を簡略化するという独自機能を提供する一方で、セキュリティが向上しており、堅牢なデータ管理、サードパーティアプリケーションとの融合が強化されたという。

 「Cloudera Enterprise 5」の具体的な強化点としては、まず、HDFSのデータセットがインメモリでキャッシュ可能となり、MapReduceのデータ処理性能が向上したため、Cloudera Impalaの分析クエリレスポンスが高速化された。また、ユーザー自身が作成したクエリ関数をCloudera Impalaと併せて利用できる「ユーザー定義関数(UDF)」機能によって、必要に応じたビジネス上のインサイトを得られるようになった。

 さらに、リソースマネジメントが進化したことで、Hadoop、YARN(Yet Another Resource Negotiator)、Cloudera Managerを結び付け、1つのクラスタ上で複数フレームワークを同時に動かし、データ処理・分析を行えるようになった。ワークロードのみならずワークグループごとにリソースを割り当て、パフォーマンスと利用状況を最適化できるので、例えば、優先度の高いデータ処理のために容量の50%をIT部門に割り当て、30%をアドホックなビジネス上のクエリに対応するマーケティング部門に割り当てる、といった柔軟な利用を実現している。

 加えて、Cloudera ManagerからClouderaのパートナーであるSAS、Revolution Analytics、Syncsortなどの製品を管理・監視できるよう強化された。このほかCloudera Navigatorでは、Hadoop上のデータの一括監査とデータ探索などを実現。データ保護―HDFSおよびHBaseでのスナップショット機能のサポート、NFS v3のサポートなども行われているとのこと。

石井 一志