ニュース

テラデータ、データ分析の新アーキテクチャ「Teradata UDA」

Teradata、Aster、Hadoopを有機的に統合

 日本テラデータ株式会社は7日、データ分析のための新たな枠組みである「Teradata Unified Data Architecture(以下、Teradata UDA)」を発表した。発表会には米Teradata インターナショナル担当プレジデントのハーマン・ウィマー氏、日本テラデータ代表取締役社長の吉川幸彦氏らが登壇した。

ハーマン・ウィマー氏
吉川幸彦氏

Teradata、Aster、Hadoopを統合するアーキテクチャ

Teradata UDAの概要図

 Teradata UDAは、統合データウェアハウス(DWH)の「Teradata」、ビッグデータ分析向けの「Teradata Aster」、オープンソースの「Apache Hadoop」という3つのデータプラットフォームを統合。相補的に活用するため、各プラットフォーム間での透過的なアクセス、自在なデータ移動、一元管理を実現するアーキテクチャである。

 Teradata UDAには、Teradata/Aster/Hadoopの各プラットフォーム製品に加えて、透過的なデータアクセスを実現する機能「Teradata SQL Assistant」「Aster SQL-H」、自在なデータ移動を実現する機能「Aster-Hadoop Adapter」「Aster-Teradata Adapter」「Teradata Connector for Hadoop」、一元管理機能「Teradata Viewpoint」が含まれる。

 また、新アーキテクチャを構成する新しいハードウェアとして、「Teradata Aster Big Analytics Appliance(以下、Aster Big Analytics)」および「Teradata Data Warehouse Appliance 2700(以下、Teradata 2700)」を3月7日より販売する。これらによって構造化データと多(非)構造化データの両方を効率よく管理、有機的に結合し、誰もが分析を行える環境を実現するという。

 テラデータによれば、「分析対象データは多岐にわたり、それらを分析するために、RDB、HDFS(Hadoop分散ファイルシステム)、MapReduce処理といったそれぞれ得意分野の異なるデータ管理と処理のプラットフォームが存在し、個別運用がなされている。また、分析ユーザーは、専門的な分析を行うアナリスト、プログラミング言語に精通するエンジニア、さらには経営層から現場の担当者まで、多様な役割・スキルレベルを持つユーザーが存在し、ニーズが混在してしまっている」。

 Teradata UDAの環境下では、データソースの収集・蓄積はHadoopに任せ、構造化データの分析はTeradata、非構造化データの分析はAsterに任せる。異なる構造のデータをそれぞれ適したプラットフォームに移動・蓄積・処理させることで、前述の混在するニーズに合理性を与えようというが、Teradata UDAだ。

透過的なデータアクセスやデータ移動の仕組みも

 単に各プラットフォームを横並びに提供するだけではなく、各プラットフォームを有機的に結合する機能も提供される。

 「アクセス」については、Teradataに対してクエリを実行するクライアント製品「Teradata SQL Assistant」をAster向けに拡張(4月提供予定)。また、Asterに搭載されている、SQLおよびSQL-MapReduceを利用してHDFSにアクセスするための機能「Aster SQL-H」によって、HDFSへの透過的なアクセスを実現する。これにより、分析ユーザーはSQLとSQL-MapReduceを利用するだけで、3つのプラットフォーム上の構造化データ、多構造化データのいずれにもアクセスが可能となる。

SQLを使ってHadoopにアクセスできるSQL-Hや、各機器間を接続するコネクタが用意される

 「データの移動」に関しては、Asterが提供する「Aster-Hadoop Adapter」「Aster-Teradata Adapter」の機能が利用可能。また、TeradataとHadoop間のデータ移動には「Teradata Connector for Hadoop」を提供。これにより、データ構造に適したプラットフォーム上で処理を行いつつ、必要に応じて自在にデータを移動できるようにする。

HadoopとTeradataで双方向のデータ・ローディングを実現する

 「管理」については、Teradata用監視ソフト「Teradata Viewpoint」をAster/Hadoop向けに拡張し、複数のプラットフォームを一元管理できる環境を提供する(6月提供予定)。また、3つのプラットフォームはいずれも日本テラデータのリモートサポートを通じて監視されるため、一貫した保守サービスが受けられるとのこと。

Teradata、Aster、Hadoopの一元管理を管理を実現する

AsterとHadoopを統合した新ハードウェアも

 このほか、新しいハードウェアとしてAster Big Analyticsを提供する

 Aster Big Analyticsは、Webアクセスログ、テキストデータ、マシンセンサーデータといった大量の多構造化データ――いわゆるビッグデータを分析するための「Aster」と、大規模データの収集・蓄積・分散処理を実行する「Hadoop」を、単一筐体に統合した業界初のアプライアンス製品。Hadoopディストリビューションとしては「Hortonworks Data Platform」を採用し、Asterが提供するSQL-MapReduceとSQL-Hを搭載している。

 繰り返しになるが、SQL-MapReduceは、Asterに用意された約70のMapReduce関数もしくは開発者がJavaなどで記述し、Aster内に配備したMapReduce関数をSQL分の中で呼び出し、実行できるもの。これにより、多構造化データに対する並列分析処理をSQL記述とほぼ同等のスキルで対話的・反復的に行える。

 一方のSQL-Hは、Hadoopに対しても、SQLおよびSQL-MapReduceで直接アクセス可能にする機能で、これらによりユーザーは同じ筐体内のHadoopに透過的にアクセスできるようになる。

 データサイエンティストやプログラミング言語に精通するエンジニアのみならず、ビジネスアナリストなど幅広い層のユーザーが、SQLおよびSQL-MapReduceを用いるだけで、構造化データと多構造化データの両方を扱える仕掛けというわけだ。

 価格は最小構成で4500万円(税別)から。初年度に約20億円の販売を目指す。

Aster Big Analyticsの概要
Aster、Hadoopそれぞれのスペック。どちらか一方の専用機にもできる

Teradataでも新モデルを発表

 あとはTeradataプラットフォームを加えれば、Teradata UDAアーキテクチャの完成だ。Teradata、Aster、Hadoopで相補的な活用が可能になるのだ。

 今回はTeradataプラットフォームの新製品としてTeradata 2700も発表した。エントリーレベルのDWH向けにハードウェアとソフトウェアをあらかじめパッケージ化し、最適化したプラットフォーム。高密度設計の新しいラックキャビネットを導入し、ノードにインテル製最新プロセッサを採用。ディスクストレージでは、搭載ドライブ数の増加、高速な書き込み処理が可能なライトバックキャッシュ機能を採用するなど、パフォーマンスを向上させるための機能強化が図られている。

 その結果、全モデルのTeradata 2690に比べてクエリ・パフォーマンスは最大2倍、ロード・パフォーマンスは最大4倍向上。さらにハードウェアによる自動データ圧縮エンジンの強化と、最大162ノード、ユーザー領域は1.6PBまでの拡張性を備えた。

 価格は5700万円(税別)から。

Teradata 2700の概要

(川島 弘之)