ニュース

EMCジャパン「Isilon」新製品を投入~「データレイク」へ前進、その狙いは?

EMC Isilon HD400

 EMCジャパン株式会社は18日、スケールアウトNAS新製品「EMC Isilon HD400」を発売した。あらゆるデータが単一のストレージ空間で管理・活用される「データレイク基盤」を実現するための製品となる。

 データレイク基盤は、単一の巨大なストレージ空間にあらゆるデータを入れて、あらゆるプロトコルで扱えるようにする構想。従来、ストレージ空間はデータ形式やプロトコルの差に応じて個別構築されてきた。この構想では、スケールアウト技術とマルチプロトコル対応により、統合的にアクセスできる巨大なデータの湖を実現する。

構想を喩え話で説明。データを「魚」、格納場所を「湖」、プロトコルを釣り竿などの「道具」に喩えると、例えば金魚すくいは縁日の屋台でポイを使うし、ブラックバス釣りなら池で疑似餌を使う。場所が違うので移動に時間がかかるし、道具が違うので別々に用意し、それぞれの魚を捕るための個別のテクニックを習得しなければいけない。「データレイク基盤」では1つの大きな湖にさまざまな魚を同居させ、まとめて用意される道具を使って捕ることができる。このために必要なストレージの拡張性やアクセスの高速性、マルチプロトコル環境を提供しようというのがこの構想である

 構想の核をなすのがIsilon。スケールアウトNASとしてファイルベースの高速ストレージを提供する同製品では、ここ最近、HDFSやRESTに対応するなどマルチプロトコル対応を推進。製品シリーズとしてはIOPS重視の「Sシリーズ」、スループット重視の「Xシリーズ」、容量重視の「NLシリーズ」を用意し、スケールアウトによる拡張性・高速性と、ストレージ階層化によるビッグデータ対応を実現するラインアップを展開している。

マルチプロトコルでデータを扱える

 今回はより容量重視でデータアーカイブ用途に最適な「Isilon HD400」を提供。「例えば、センサーから吐き出される大量のデータを保存しておきたいといったニーズに応える」としている。

 Isilon HD400では、従来比2.5倍の容量となるクラスタあたり50PBを実現。ディープアーカイブやディザスタリカバリといったデータレイクの最深部の位置する基盤として訴求する。このIsilon HD400をはじめ、スピード重視と容量重視のほかのIsilonも組み合わせ、必要に応じてスケールアウトすることで、「従来は2台、多くて4台までしか拡張できなかったストレージのコントローラーを100ノード、200ノードと拡張することで、今まではデータがあってもできなかったような分析などが可能になる」という。

Isilonのラインアップ
さらに容量を重視したIsilon HD400

 Hadoop環境の連携も進め、従来のPivotalとClouderaに加えてHortonworksをサポート。HDFSも2.3および2.4をサポートし、「Ambari(Hadoopクラスタ管理・プロビジョニング)」「Oozie(ジョブスケジューラー)」といった各種ツールとの動作保証も付けた。

 「OpenStack Swift」もサポート。さらにマルチプロトコル対応を進め、「第3のプラットフォーム」時代に作成されるアプリからデータを扱える幅を広げた。

 このほか、データレイク基盤を担うストレージ製品として、Isilon以外に「EMC Elastic Cloud Storege(ECS)」も利用可能にした。EMC製・他社製のコモディティハードウェアに、Software-Defined Storageを実現するソフト「ViPR」を搭載し、スケールアウト可能なブロックストレージを実現する製品だ。IsilonとEMC ECSを混在させてデータレイクを創り出し、ファイル・オブジェクト・Hadoopの環境を同時に実現するという。

 EMCジャパンが昨今、データレイク基盤構想に注力している背景には、これまで企業やデータセンターで構築されてきたシステム、アプリ、データ資産を、Hadoopなどの「第3のプラットフォーム」で構築される新たなアプリ環境で利用したいというニーズがあるという。ビッグデータで表される膨大なデータ量に対応するために処理の高速性が必要となり、あらゆるクラウドアプリでデータを扱えるようにするためにマルチプロトコル環境が必要となるわけだ。

 両プラットフォームの架け橋となるストレージ空間を「データレイク基盤」という形で実現するため、EMCではこの構想を「Platform 2.5」と表現している。

川島 弘之