Enterprise Watch
バックナンバー

日立の新世代ディスクサブシステム「SANRISE Universal Storage Platform」


株式会社日立製作所 RAIDシステム事業部 事業企画本部 製品企画部 部長代理の高松久司氏
 国内外で定評のある株式会社日立製作所のディスクサブシステム「SANRISE」シリーズ。欧米ではTagmaStoreやLightning、Thunderといった名称で親しまれている製品だ。その中でも最上位となる「SANRISE Universal Storage Platform」は、世界で初めてディスクアレイ装置上にストレージ仮想化機能を搭載した新世代のディスクサブシステムである。

 今回は、SANRISE Universal Storage Platformが持つ数々の特徴と日立製作所が推進するDLCM(Data Life Cycle Management)基盤について、株式会社日立製作所 RAIDシステム事業部 事業企画本部 製品企画部 部長代理の高松久司氏にお話を伺った。


ストレージコントローラ上にストレージ仮想化機能を実装

 SANRISE Universal Storage Platform(以下、SANRISE USP)は、昨年9月に発表されたSANRISEシリーズの最上位モデルだ。第3世代のクロスバースイッチ技術を採用したUniversal Star Networkアーキテクチャによってプロセッサ能力やデータ転送パスの強化を図り、200万IOPSという世界最高クラスの処理性能を実現している。この結果、従来のSANRISE 9900Vと比べて、データベーストランザクション性能は約2倍、バッチ処理性能は約4倍に向上している。接続性にも優れており、最大192のファイバチャネルポートをサポートし、NAS、IP、FIBARC/FICON、ACONARC/ESCONなどのマルチプロトコルに対応する。


SANRISE Universal Storage Platform SANRISE USPの中核となるUniversal Star Networkアーキテクチャ(出典:日立製作所、以下同様)

 SANRISE USPで最も特徴的なのがストレージ仮想化機能である。近年、ストレージシステムの中にはベンダや機種の異なる複数のストレージが混在し、ストレージの管理や運用が複雑化している。こうしたヘテロジニアスなストレージ環境において、容易かつ効率的なストレージ管理を提供するのがストレージ仮想化機能の主な役割となる。

 ストレージ仮想化の手法には、一般にネットワークスイッチ型とアプライアンスサーバー型の2種類がある。ネットワークスイッチ型は、サーバーとストレージの間に配置するファイバチャネルスイッチにストレージ仮想化機能を実装する方式だ。この方式は、既存のSAN構成をそのまま利用できるという利点を持つ。アプライアンスサーバー型は、サーバーとファイバチャネルスイッチの間にストレージ仮想化機能を提供する専用のアプライアンスサーバーを追加する方式で、専用ハードウェアならではの高い柔軟性が利点となる。

 これらに対し、SANRISE USPはストレージ仮想化の新方式となるネットワークストレージコントローラ型を採用している。ディスクストレージはマイクロプログラムと呼ばれるソフトウェアで動作しており、このマイクロプログラムにストレージ仮想化機能を実装するのがネットワークストレージコントローラ型である。SANRISE USPは、機種の異なる複数のディスクストレージの接続をサポートしている。これらのディスクストレージを外部ストレージと呼ぶ。SANRISE USPは、自身の内蔵ストレージとこれらの外部ストレージをすべて仮想化し、単一のストレージプールを作成したり、複数のストレージ間でのコピー機能を提供したりする。

 「SANRISE USPのストレージ仮想化によって複数のディスクストレージを仮想的に1台のストレージとして統合し、ストレージ群を運用、管理できるようになります。SANRISE USPは非常に高い信頼性を実現できるような形で設計されていますので、データの保持、移動、コピーなどの信頼性も必然的に高いものとなります。また、大容量のキャッシュメモリによる高速なI/O処理も大きな特徴といえます。他の二方式にもそれぞれメリットがありますが、信頼性や性能の面からいえば弊社のネットワークストレージコントローラ型のほうが優れています(高松氏)」。


ストレージ仮想化の実装方式(ネットワークスイッチ型) ストレージ仮想化の実装方式(アプライアンスサーバー型) SANRISE USPのネットワークストレージコントローラ型

膨大なストレージ容量を一元管理できるUniversal Volume Manager

 SANRISE USPで特に注目したい機能が、Universal Volume Manager、Virtual Partition Manager、Universal Replicatorの3つである。


SANRISE USPの内蔵ストレージと外部ストレージをストレージ仮想化によって統合し、一元管理を可能にするUniversal Volume Manager
 Universal Volume Managerは、SANRISE USPの内蔵ストレージと、これに接続された機種の異なる複数の外部ストレージを一元管理する機能である。ここでいう一元管理とは、ボリューム管理、容量管理、アクセスセキュリティ管理、パス管理などを指す。外部ストレージには、SANRISEシリーズの旧機種に加え、同社のミッドレンジ製品、ニアライン製品、さらには他社のディスクストレージなどがサポートされる。今後も新しい製品を順次追加し、外部ストレージのサポート範囲を広げていく予定だという。

 SANRISE USPで管理できるストレージ容量は実に膨大だ。まず、SANRISE USP自身で332TBのストレージ容量を持つことができる。これは300GB HDDを搭載したときの数字であり、将来的により大容量のHDDが登場すれば、内蔵ストレージの容量はさらに拡大する。そして、外部ストレージとして内蔵ストレージの約100倍にあたる合計32PBのストレージ容量を管理できる。すなわち、SANRISE USPのストレージ仮想化機能を通じて、合計32PBのストレージ容量を単一のストレージプールとして扱える計算になるのだ。

 SANRISE USPのストレージ仮想化機能は、単一のストレージプールを作成するだけにとどまらない。規模や性能の異なる外部ストレージに対するデータコピー、アーカイブ、マイグレーションなどを提供する役割も果たす。これにより、後述するDLCM(Data Life Cycle Management)基盤をSANRISE USP内で構築できるようになる。データの利用価値に見合ったストレージにデータを効果的に配置することで、既存投資を有効活用しながらストレージ全体のTCO(Total Cost of Ownership)を削減する。IT投資効果測定コンサルタント会社、米IT Centrix社の試算によれば、内部ストレージ100TB、外部ストレージ400TBの合計500TB構成で3年間使用したときのTCOは、SANRISE USPの導入を通じて約30%削減できるとしている。


複数の業務で1台のSANRISE USPを効率よく共有できるVirtual Partition Manager

SANRISE USPのリソースをアプリケーションや業務処理ごとに分割し、QoS管理を実現するVirtual Partition Manager
 2つ目のVirtual Partition Managerは、SANRISE USPのリソースをアプリケーションや業務処理ごとに分割する機能である。企業には、要求される性能や必要容量が異なる業務が複数混在するが、こうした社内業務を1台のストレージでまかなうには、業務ごとのデータを個別に管理し、互いの干渉を防ぐ必要がある。Virtual Partition Managerは、ディスクアレイ内に専用のディスク、キャッシュメモリ、サーバー接続ポートを割り当てた仮想ストレージ装置を設け、社内の業務ごとにこれらの仮想ストレージ装置を割り振ることで業務ごとのQoS(Quality of Service)管理を実現する。

 例えば、ある業務に携わる1台のサーバーからアクセスが集中したとき、このサーバーによるキャッシュメモリの占有が大きな問題となる。キャッシュ機構で一般に採用されているアルゴリズムは、よく使われるデータや最近使われたデータの優先順位を高くするLRU(Least Recently Used)だ。このため、キャッシュメモリ全体をすべてのサーバーで共有すると、I/Oが多いサーバーが優先的にキャッシュを埋める結果となる。従来は、この問題を大容量のキャッシュメモリによって軽減してきたが、キャッシュメモリは非常に高価なコンポーネントであり、そうそう満足のいくレベルまで搭載できるわけではない。

 Virtual Partition Managerは、サーバーごとにキャッシュメモリを割り当てることで、こうした問題を大きく軽減する。従って、あるサーバーのI/Oが急激に増えたとしても、このサーバーが占有するキャッシュメモリはVirtual Partition Managerで割り当てられたサイズが上限となり、それ以外のキャッシュはいっさい影響を受けない。

 キャッシュ容量の割り当てに際しては、割り当てサイズが最適であるかどうかを判断する指標としてストレージ管理ソフトウェア「JP1/HiCommand」のTuning Managerを用いることができる。最初はある種の経験をもとにキャッシュ容量を割り当てていくが、そのサイズが必ずしも適切であるとは限らない。そこで、Tuning Managerによって実稼働環境において性能が期待値に達しているかどうかをチェックし、もし期待値に達していなかったらキャッシュの割り当てサイズを増やしていく。逆に、より少ないキャッシュメモリでも十分な性能が出るようならば、キャッシュのサイズを減らし、その減らした分を別のサーバー用として割り当てればよい。


より安定したリモートコピーを実現するUniversal Replicator

 3つ目のUniversal Replicatorは、サーバーフリーの遠隔コピー機能であるTrueCopyの改良版にあたる。TrueCopyは、データ転送方式として同期型と非同期型をサポートしている。近距離のレプリケーションでは、同期型が用いられる。同期型は、リモートサイトのストレージにデータが書き終わってから、プライマリサイトのホストに書き込み完了の通知(コミット)を行う方式だ。同期型は、近距離ではかなり高い性能を期待できるが、回線遅延が発生しやすい遠距離通信では性能を発揮しづらい。

 そこで、遠距離のレプリケーションでは、実際の書き込みが完了する前にコミットを済ませる非同期型が用いられる。これにより、回線遅延が多少発生したとしても、高い性能を維持できる。ただし、ディスクI/Oや回線トラフィックが急増すると、レプリケーション用に割り当てたキャッシュメモリの区画がオーバーフローし、レプリケーション作業が中断してしまう。I/Oや回線トラフィックが少なくなれば再同期が行われるが、レプリケーションが中断している間はリモートサイトのディスクにデータがコピーされていない状態となる。つまり、データ保護が行われていないということだ。

 従来は、レプリケーション用のキャッシュを増やすことで対処してきたが、Virtual Partition Managerのところでも説明したようにキャッシュメモリは非常に高価である。そこで、Universal Replicatorは、非同期型レプリケーションの書き込みデータをジャーナル情報(ホストからの書き込みデータを時間順に並べた履歴情報)として管理してディスクに保管するように改良した。ディスクなら容量を容易に確保できるため、キャッシュメモリのようなオーバーフローはまず発生しない。これにより、ディスクI/Oや回線の帯域が大きく変動した場合でも、安定したリモートコピーが実現される。これを逆に言うと、帯域幅は不安定ながらも回線コストが安価なIPネットワークを利用して長距離レプリケーションの運用コストを下げることも可能だ。


3つのデータセンターを利用した堅牢なディザスタリカバリ構成
 Universal Replicatiorを利用した面白い事例として、3つのデータセンターを利用したディザスタリカバリがある。日立は、このような構成を3 datacenterと呼んでいる。通常、ディザスタリカバリを構築する場合、東京と大阪のような、ある程度距離が離れたサイト間で非同期型コピーを行う。3 datacenterでは、遠距離のリモートサイトに加え、プライマリサイトに近い場所(東京の近郊だと横浜など)にもホットサイトを設ける。

 そして、プライマリサイトとホットサイト間ではTrueCopyによる同期型コピーを、プライマリサイトとリモートサイト間ではUniversal Replicatiorによる非同期型コピーを実施する。こうすることで、例えば地震などで東京だけが被害を受けたときには、横浜のホットサイトからすぐにシステムを復旧できる。また、東京も横浜も被害を受けるような大規模災害が発生したときには、大阪のリモートサイトからシステムを復旧できる。このように、災害の状況に応じた復旧を複数段で行えるのが3 datacenterの大きな特徴だ。


日立が考えるILMの理想型 - DLCM

日立が推進するDLCM(Data Life Cycle Management)
 日立は、独自のデータ統合管理ソリューションとしてDLCM(Data Life Cycle Management)を提唱している。DLCMは、作成から活用、保存、廃棄に至るまでの一連のライフサイクルをもとにデータをとらえる。そして、時間の経過とともに変化するデータの利用価値に応じて、その時々で最適なストレージをハイエンド、ミッドレンジ、ニアラインといった形で選択し、データを効率的に管理、運用する。このように、DLCMは他社でいうところのILM(Information Lifecycle Management)に非常に近い概念といえる。これに対し、高松氏は他社のILMと日立のDLCMの違いを次のように説明する。

 「データのライフサイクルに着目し、複数のストレージにデータを配置してストレージのコストを抑えるという考え方そのものは他社のILMと似ています。ただし、弊社のDLCMは、ディザスタリカバリのためのリモートコピー、そのリモートサイトでのアーカイビングなど、地域的な広がりを含んだ形のシステム構築を包含する点が大きな特徴となります」。

 「さらに、一般にILMでは業務のやり方など、かなり上位のレイヤまでが含まれていますが、DLCMではハードウェアからアプリケーションまでのレイヤ、すなわちライフサイクルを通じたデータの管理と保存に焦点を当てています。というのも、上位レイヤの概念を入れすぎると、上位レイヤの問題点を解決しない限り、つまり業務のやり方を変えない限り、先に進めないという問題が発生してしまうからです。あくまでも、現在の業務にうまく適応する形でストレージを運用するというのがDLCMの基本的な考え方となります(以上、高松氏)」。

 今年2月には、SANRISE USPを含む複数のストレージでDLCMを実現する階層ストレージリソース管理ソフトウェア「Tiered Storage Manager」が発表された。日立は、多種多様なストレージハードウェアとこうした高機能ソフトウェアを効果的に組み合わせることで、DLCMが目指すところの高度なデータライフサイクル管理を実現する見込みだという。



URL
  株式会社日立製作所
  http://www.hitachi.co.jp/


( 伊勢 雅英 )
2005/04/04 00:00

Enterprise Watch ホームページ
Copyright (c) 2005 Impress Corporation, an Impress Group company. All rights reserved.