ニュース

思考のままにHadoopデータをビジュアル分析、SAS Japanが新製品

「SAS In-Memory Statistics for Hadoop」を発売

 SAS Institute Japanは4月17日、ビッグデータ分析ソフトの新製品「SAS In-Memory Statistics for Hadoop」と、データ可視化機能を持つ「SAS Visual Analytics」の最新版「6.4」について記者説明会を行った。SAS In-Memory Statistics for Hadoopは同日より、SAS Visual Analytics 6.4は4月1日より提供を開始している。

思考のままビジュアルにHadoopデータを分析

北川裕康氏

 SAS Institute Japan マーケティング&ビジネス推進本部長の北川裕康氏は、「競争の激化やデータの増大、ビジネス環境の変化といった課題に対し、企業はデータからインサイトを得るための新たな分析方法を探している。しかし、こうした課題はBIやRDBMSなど従来のアナリティクス環境では対応しきれなくなってきており、この環境をモダナイズ(近代化)する必要がある。SASでもこのところHadoopを中心にテクノロジの近代化に取り組んでいる」として、Hadoop対応製品を発表した背景を説明した。

 SAS In-Memory Statistics for Hadoopは、分散並列インメモリ技術をベースとしたHadoop対応製品で、Hadoopクラスタ上でインタラクティブなアナリティクスプログラミング環境を提供する。主にデータサイエンティストをターゲットとした製品で、「ITスキルやHadoopスキルがなくても、思考のままビジュアルにHadoopデータが分析できる」(SAS Institute Japan ビジネス推進本部 アナリティクスプラットフォーム推進 マネージャーの小林泉氏)。

SAS In-Memory Statistics for Hadoopのアーキテクチャ
SAS In-Memory Statistics for HadoopがデータサイエンティストをITスキルから解放する

 同製品は、インメモリ分析プログラミング言語を利用しており、複数のユーザーがHadoop上で同時に大量データを分析できるという。データの抽出や変換、探索、モデリング、スコアリングなど、すべてHadoop上で実行が可能だ。

 こうした分析のライフサイクルをHadoop上で実行するには、従来複数の異なるプログラミング言語やIT製品を組み合わせる必要があったという。そのため、ビジネスプロセスにモデルを組み込む際はソフトウェアに拡張性がないことが課題だったが、SAS In-Memory Statistics for Hadoopではデータ準備からモデル開発、展開に至るまで、分析のアウトプットを単一プラットフォームで実現できるという。

 また、SAS In-Memory Statistics for Hadoopは事前にデータをメモリに読み込むため、データのディスクI/O処理は不要となる。このため、データレイテンシが削減され、データの準備時間が短縮できるという。

SAS In-Memory Statistics for Hadoopの画面

非構造化データの分析を強化した「SAS Visual Analytics」

 一方のSAS Visual Analyticsは、ビジネスユーザーやアナリスト向けの製品だ。対話型のビジュアルデータ検索機能や、最適なグラフの種類を自動的に選択、設定するオートチャーティング機能、時系列予測やシナリオ分析といった分析ビジュアル化機能などを備えている。

 最新版の6.4では、非構造化データの分析機能が強化され、顧客のコメントやTwitterストリームが解析できるようになったほか、ワードクラウドなどのビジュアル化でトレンドが表示できるようになった。また、セルフサービス型のデータインポート機能と強化されたデータ準備機能により、ClouderaやGreenplum、Hortonworks、Oracleなど17種類のデータソースの並列高速ローディングが可能となった。

SAS Visual Analyticsの強化ポイント

 さらには、アーキテクチャオプションを追加し、企業が持つHadoop環境との親和性を強化した。Hadoopでビジュアル化を実現するには、データロード時間がかかるという課題があるが、SASでは「Asymmetric(非対称)アーキテクチャ」と「Haddopクラスタ共存アーキテクチャ」という2通りの手法でデータロード時間を短縮するという。

 Asymmetricアーキテクチャは、Hadoopクラスタからデータを並列に別クラスタのインメモリ環境にロードする方法だ。もうひとつのHadoopクラスタ共存アーキテクチャは、Hadoopクラスタ上にてHadoopクラスタのメモリを活用し、インメモリでビジュアル化を実現する方法。ユーザーのハードウェア環境などによって、効率の高い方を選択できるという。

Asymmetric(非対称)アーキテクチャ
Haddopクラスタ共存アーキテクチャ

 小林氏によると、今後さらにHadoop対応製品を増やす予定だという。2014年後半には、データマネジメントツールの「SAS Data Director for Hadoop」「SAS Code Accelerator for Hadoop」「SAS Data Quality Accelerator for Hadoop」といった製品や、データ検索および予測モデリングツールの「SAS Visual Statistic」などもリリースするとしている。

2014年に登場するHadoop関連製品

沙倉 芽生