クラウド&データセンター完全ガイド:特集

普及元年か、導入の機が熟したフラッシュストレージ

データセンターの要[ストレージ]の進化ベクトル[Part1]

データセンターの要[ストレージ]の進化ベクトル
[Part1] Introduction
普及元年か、導入の機が熟したフラッシュストレージ

サーバーやネットワークでは、この数年大きな進化が見られない安定した状況が続いているが、ストレージに関しては急速な進化が進行中で、ITインフラの構成要素中、現時点で最も変化があって面白い分野だと言って過言ではない。現在、多くの関係者が口にしているのが「2016年はフラッシュストレージ元年」というフレーズであり、数年かけて普及拡大してきたフラッシュストレージがいよいよ、ティア1のメイン記憶媒体というエンタープライズストレージの主役に躍り出ることになりそうだ。

2016年は「フラッシュストレージ元年」か

写真1:サンディスクのデータセンター向けPCI Express接続SSD「Fusion ioMemory SX350」(出典:米サンディスク)

 今、ストレージ分野を全体俯瞰する際、とりわけ目立っているのがフラッシュ/SSD(Solid State Drive)ストレージだ(写真1)。「今年は○○○○元年」といった表現は、これまでも発展途中のさまざまなテクノロジーに関して使われてきたが、なかには「そうなってほしい」という関係者の願望でしかないものも相応に含まれており、実際不発のままに終わったものも少なからず存在する。

 しかし、フラッシュストレージに関しては願望や希望的観測などではなく、多少のタイミングのズレはありえるとしても、HDDからフラッシュへという記憶媒体の主役交代は近々に確実に起こる事態だと目されている。

 その理由としてはいくつか挙げられるが、従来、フラッシュストレージの最大の弱点であった「HDDと比較した場合の容量単価」での不利がほぼ解消された点が大きい。もちろん、物理的な記憶容量をベースに比較すれば、現時点においてもフラッシュはHDDよりも高価となることは変わっていない。しかし、フラッシュ/SSDの高速性を生かし、インラインでのデータ圧縮や重複排除を併用することで、実効容量という観点でHDDと比較すれば容量辺りのコストでフラッシュのほうが安価になる例が増えてきたということである。

 データ圧縮に関しては、例えばJPEG画像ファイルやMP3音声ファイルのような圧縮済みファイルをストレージ側でさらに圧縮しようとしても当然、ほとんど効果がない。一方、テキストファイルなどではデータ圧縮による実効容量の増大効果は劇的なものとなる。HDDでもデータ圧縮や重複排除の活用はもちろん可能だが、そもそもCPUに比べ大幅に低速なHDDのデータI/Oに、さらなる処理負荷を加えることになり、パフォーマンスに大きな影響を及ぼす。

 高速なフラッシュの場合、こうした処理が加わっても、まだHDDよりも高速なパフォーマンスを維持できる。もちろん、データ圧縮や重複排除に関してはソフトウェア処理であり、その実装のしかたによってパフォーマンスが大きく変動する。ベンダー間で差が生じやすい部分であり、優位性を強くアピールしているところもある。実際には、記録するデータの特性によっても変わってくると考えられるため、正確な評価のためには実データによる検証が必要になろう。とはいえ、製品としての熟成がかなり進んできているため、どのベンダーもおおむね期待されるパフォーマンスレベルはクリアしているとみてよいだろう。

 フラッシュメモリ自体も順調に低価格化が進行している。現在では3D NAND技術による高密度実装のフラッシュメモリが主流となりつつあり、これが大容量化と低価格化の駆動要因となっている。同様に、フラッシュチップにはSLC(Single Level Cell)とMLC(Multi Level Cell)という区別もある。SLCは1つのセルに1ビットのデータを記憶し、MLCでは1つのセルに複数ビットを記録できる。当然ながらMLCのほうが、記録容量が大きくなるが、エラーの可能性はSLCよりも大きくなることが懸念される。

 このことから、かつてはエンタープライズ向けのストレージではSLCを採用していることをアピールする製品もあった。しかし、現在ではMLCの信頼性が向上したことに加え、フラッシュチップを製造する半導体メーカーの主力製品が3D NAND TLC(Triple Level Cell、MLCの一種で1セルに3ビットのデータを記録する)に移行しつつあることから、もはやストレージベンダーとしてもSLCや2ビットMLCを使うことは現実的ではなくなりつつある。しかしながら、こうしたトレンドがフラッシュストレージの容量増加に寄与し、バイト単価を引き下げていることから、ユーザーにとっては歓迎すべき技術革新となっていることも間違いない。

フラッシュで重要度を増したソフトウェア技術

 フラッシュストレージに関しては、当然ながらHDDに対するフラッシュ/SSDの優位性にのみ注目しがちだが、実際にはストレージソフトウェアの進化が急速に進行していることも見逃せない。

 PCやサーバーに内蔵されたHDDは、事実上特段のソフトウェアの支援なしに“生の”物理デバイスをそのままOSが利用する仕組みになっている。外付け型ストレージに関しても同様のイメージで、単に大量のHDDを専用の筐体に収めただけと考えたくなるが、実態はそう単純ではない。

 例えば、RAIDも物理的/機械的な障害の発生確率が高いHDDの弱点をソフトウェアによってカバーするための工夫であり、ストレージ製品は本質的に物理的な記憶媒体と適切なソフトウェアの組み合わせで動作するアプライアンス製品である。従来のHDDストレージ製品の場合、HDDのパフォーマンスの制約から、あまり高度な処理を行うことができなかったゆえにソフトウェアの比重も一定にとどまっていた。一方、フラッシュストレージではHDD時代の制約が解かれ、ソフトウェアによる付加価値が大きな存在感を示すようになっている。

 また、フラッシュメモリの特性上、HDDのように特定の領域に単純にデータを書き込むだけでは済まず、必然的にソフトウェアによる支援が必須となる面もある。具体的には、ウェアリング(損耗)の問題だ。フラッシュメモリは物理的な特性としてデータの書き込み回数に制約がある。書き込みごとにセルが劣化し、ある程度以上劣化が進行するとセルが使用不能になるという特性だ。そのため、単純にOSがフラッシュメモリ上にファイルシステムを構築し、データの読み書きを行うようにしたとき、特定のセルに書き込みが集中し、すぐに損耗してしまうことになる。

 こうした事態を避けるため、フラッシュストレージではOSがアドレス指定する記憶領域と実際の格納場所を切り離している。OSが関知しないところで物理的なセルの位置を変更するなどして利用可能なすべてのセルが平均的に使用されるような最適化処理を行うという仕組みだ。つまり、フラッシュストレージはそもそもソフトウェアの支援なしには成立しない製品であり、ソフトウェアの優劣が性能差に直結する構造になっているとも言える。

 上述したように、現在主流のフラッシュストレージはインラインのデータ圧縮や重複排除が実装された製品が増えてきている。さらに、フラッシュに特化した新興ベンダーの製品では、特定用途向けに設計されたソフトウェアを実装することで競合製品との差別化を図るケースもある。

 例を挙げると、ティントリ(Tintri)の場合、最初の製品から仮想化対応を前面に打ち出している。従来型のストレージがボリューム単位での管理を基本とするところを、同社のストレージは仮想マシン単位での可視化・制御を可能としており、大量の仮想マシンを運用する場合のストレージとして使いやすいようにデザインされている。

 このような明確な性格づけが可能なのも、HDDからフラッシュに移行することによってパフォーマンスに余裕が生じ、さらに信頼性や運用管理性の向上といったメリットが得られる点が大きい。機械的障害の発生というHDDの弱点がフラッシュによって解消された結果、ストレージシステムは急速な進化を遂げつつある状況だ。

 図1は、フラッシュストレージの導入目的を尋ねたIDC Japanのユーザー調査の結果だ。本稿で述べたメリットを考えると、常用するティア1のストレージシステムを導入する際、フラッシュストレージは最初から候補に挙がることになろう。

図1:フラッシュストレージの導入目的(出典:IDC Japan「国内企業のストレージ利用実態に関する調査 2014年度版」2014年2月)

(データセンター完全ガイド2016年夏号)