ニュース

日本IBM、ビッグデータ向け統合システム「PureData」にHadoop基盤の新製品

「IBM PureSystems」ファミリー

 日本IBMは15日、ビッグデータ処理に特化した統合プラットフォーム「IBM PureData System」のラインアップ拡充を発表した。新たに、Hadoop基盤を提供する「IBM PureData System for Hadoop H1001」、およびNetezza技術を実装したハイ・パフォーマンス・アナリティクス基盤のエントリーモデル「IBM PureData System for Analytics N2002-002」を提供する。発売はともに本日より、出荷は前者が本日、後者が10月18日より。

 同社は、垂直統合型「エキスパート・インテグレーテッド・システム」として、クラウド、ビッグデータ、アナリティクスなど幅広く柔軟なシステム基盤の構築・運用を支援する「IBM PureSystems」ファミリーを提供。

 中でもビッグデータ向けの「IBM PureData System」のラインアップにおいては、高速データ入出力処理(データベース)用「IBM PureData System for Transactions」、大容量データの高速分析処理(データウェアハウス)用「IBM PureData System for Analytics」、次々に取引される業務処理データを蓄積データと照合するような即時的な分析処理用「IBM PureData System for Operational Analytics」を展開している。

Hadoopの構築・運用に特化した新製品

ソフトウェア事業 インフォメーション・マネジメント事業部長の望月敬介氏

 「IBM PureData System for Hadoop」はこの「IBM PureData System」のラインアップに追加される新製品で、テキストや画像など大容量の非構造化データの並列分散処理や解析を実行するHadoop環境の構築・運用に特化。Hadoop環境の構築に必要なハードウェア、ソフトウェア、ストレージを統合して最適化した状態で出荷されるため、システム稼働までの手間と時間を大幅に削減する。

 ソフトウェア事業 インフォメーション・マネジメント事業部長の望月敬介氏は「ビッグデータ分野ではあらゆる種類のデータを処理することが求められ、それぞれに最適な技術がまちがいなく存在する。特に大手ユーザーはエコシステムに含まれるすべてのデータを管理・統制する必要がある」と指摘。その上で「Hadoopは広く利用されているが、その構築・運用には手間がかかる。新たなデータソースを柔軟に採り入れ、長期的・段階的にビッグデータに取り組むためには、事前最適化されたアプライアンスとして統合プラットフォームが重要」だと、統合プラットフォームの必要性と新製品の価値を訴求した。

 「IBM PureData System for Hadoop」は、Hadoopをベースに同社のHadoop基盤ソフト「IBM InfoSphere BigInsights」を採用し、ANSI(米国協業分野の標準化組織)に準拠したSQLでHadoop上のデータを扱える「BigSQL」、プログラミングなしにデータを可視化・編集できるスプレッドシート形式の「BigSheets」、ハードウェアも含めてWebブラウザで監視・管理できる統合管理ツールなどを備えている。また、データウェアハウス・システム「IBM PureData System for Analytics」との連携も可能で、同システム上のデータをインポート/エクスポートすることが可能となる。

 スペックとしては、IBMのx86サーバーをベースに18台のデータノードと冗長化された2台のマスターノード、10/40 Gigabit Ethernetを最適に組み合わせたネットワークから構成される。データノードの内蔵ディスクはHDFSでフォーマットされ、データは圧縮して格納されるため、およそ1PBを格納することが可能。数日で初期設定を完了できるよう統合された状態で出荷されるため、迅速かつ容易にHadoop環境を利用できる。

IBM PureData System for Hadoopの概要
ビッグデータ向けに統合プラットフォームを提供する必要性

ハイ・パフォーマンス・アナリティクスのエントリーモデル

 「IBM PureData System for Analytics N2002-002」は、Netezza技術を採用したビッグデータ分析システム「IBM PureData System for Analytics」に追加されるエントリーモデル。Netezza技術の特長である超並列処理のシステム設計はそのままに、データ処理を行うブレードやディスクの本数を抑えることで、エントリークラスに求められるコストパフォーマンスを実現している。

IBM PureData System for Analytics N2002-002の概要
[2枚目のキャプション]主なスペック

企業はビッグデータの本格展開へ取り組み始めている

2012年のビッグデータ取り組み状況

 IBM Institute for Business Valueとサイード・ビジネス・スクールによる共同調査によると、2012年に企業のビッグデータの取り組みは、準備が24%、検討が47%、試行が22%、実行が6%だった。「しかし、2013年の別の調査では、68%が投資を決定・開始したと報告されており、確実に浸透。手の出しやすいソリューションが出始めた証左となっている」と望月氏。

 扱われるビックデータのソースもトランザクション(88%)、ログ(73%)、イベント(59%)、メール(57%)などのほか、ソーシャルメディア、センサー、POSデータ、地理情報、音声、動画などが40%前後活用されており、さまざまなデータが分析対象になりつつあるという。

川島 弘之