クラウド&データセンター完全ガイド:特集

次世代SSD、ソフト制御の高度化……まだまだ進化するデータセンターストレージ

AIコンピューティング時代のITインフラテクノロジー(Part 2)

弊社刊「クラウド&データセンター完全ガイド 2018年夏号」から記事を抜粋してお届けします。「クラウド&データセンター完全ガイド」は、国内唯一のクラウド/データセンター専門誌です。クラウドサービスやデータセンターの選定・利用に携わる読者に向けて、有用な情報をタイムリーに発信しています。
発売:2018年6月30日
定価:本体2000円+税

エンタープライズIT分野はかなり成熟が進んできた印象があるが、ストレージについては現在も活発な技術的進化が進行中だ。今やデータセンターの主役に躍り出たストレージの進化ベクトルを、「SSD/ フラッシュのさらなる進化」「ソフトウェア制御の高度化」「データセントリック」などのキーワードを挙げつつチェックしてみる。 text:渡邉利和

データセンターでもSSD/フラッシュがデフォルトへ

 企業ITインフラにおけるストレージメディアの技術的主役は長らくハードディスクドライブ(HDD)が君臨していたが、2015年から2016年にかけて、ソリッドステートドライブ(SSD、写真1)/フラッシュメモリに取って代わる流れになり、2017年に世代交代を終えたという状況だ。

 処理速度に関しては技術特性上、登場時点からSSDが優位に立っていたが、ドライブ単位で見た場合の容量の小ささや容量単価の高さが問題視され、HDDを置き換えるのではなく、HDD主体のストレージに、高速なキャッシュ領域として小容量のSSDを組み合わせるという構成から、SSDが普及し始めた。当時、既存のストレージ製品ベンダーはSSDを高価な追加オプションとして位置づけ、段階的に市場拡大に取り組んでいた。

写真1:インテルのデータセンター向けハイエンドSSD「Optane SSD DC P4800Xシリーズ」(出典:米インテル)

 一方で、こうした段階を飛び越えて、筐体内の全メディアをSSD/フラッシュで構成したオールフラッシュストレージを売りにする新興ベンダーが2010年代初頭に次々と市場参入を果たしている。このとき盛んに議論されたのは、「SSDかローフラッシュ(RAW Flash)か」だった。

 ローフラッシュは、PCIバスなどに直結する形でフラッシュメモリの高速性を最大限に引き出す技術アプローチをとる。HDDと同様、ドライブとして装着し、SAS(Serial Attached SCSI)やSATA(Serial ATA)といったディスクインタフェースを介してシステムと接続するSSDに対し、ローフラッシュは、PCIスロットインタフェースの拡張カード上にフラッシュチップを並べる形態になる。

 SASやSATAは、HDDを接続する前提で設計されているので、そのデータ転送速度もHDDの性能向上に合わせて決められており、後に登場したSSDに対しては対応しきれず、高速性を生かしきれない状態が続いていた。

 一方、CPUからダイレクトにアクセス可能なPCIバス直結型のローフラッシュなら、本来フラッシュメモリが備えるパフォーマンスの限界まで引き出すことができる。HDDに対して圧倒的な性能差を実現することがフラッシュへの移行を促すと考えてローフラッシュ採用製品の開発を選んだベンダーと、コストパフォーマンスの高いSSDを採用し、ソフトウェア面での機能強化や差別化を図ろうとしたベンダーの両方が市場で競ったが、現在はその判断の是非についておおよその結論が出ていて、後者が主流だ。

 ただ、現在では、NVMe(Non-Volatile Memory Express)という標準インタフェースが策定され、ローフラッシュのアプローチがあらためて脚光を浴びるかたちにはなっている。

ストレージの付加価値を生む高度なソフトウェア制御

 オールフラッシュストレージが普及を始めるなか、既存のストレージベンダーも従来のHDD主体で小容量のフラッシュというアプローチと並行して、新設計のオールフラッシュストレージの提供を相次ぎ開始している。

 オールフラッシュストレージのアドバンテージとして大きな役割を果たしているのが、ソフトウェアによる付加価値の提供だ。

 SSDベースのオールフラッシュストレージの普及拡大に大きく寄与したと思われるのが、インラインでのデータ圧縮/重複排除機能の提供だろう。SSDの高速性を生かしてデータ転送の途中に追加処理としてデータ圧縮/伸張や重複排除の処理を行うことで、実際にストレージ内部に記録されるデータ量をサーバー側から見えるデータ容量よりも少なく抑えることができる。

 データの種類や特性に応じて圧縮率が変わってくるが、仮に平均して50%の圧縮が可能だったとすれば、SSDの容量単価がHDDの容量単価の2倍以下であればコスト競争力を持てる計算になる。もともとSSDはHDDよりも高速なので、その分を踏まえて多少のコスト増なら受け入れられるというユーザーは少なからず存在していたが、圧縮/重複排除を活用した上で、市場拡大に伴う集荷量増大によるコストダウンなども組み合わせると、ユーザーから見た実効容量で比較すると容量単価でSSDがHDDよりも安価になる可能性も出てきている(図1)。

 かつて、SSDを選ぶのに、SSDでなくてはならない理由を説明することが求められていた。ここで述べたように、既存の大手ストレージベンダーもオールフラッシュストレージを取りそろえてきたことで、今となっては逆にHDDを選ぶ場合になぜSSDにしないのかの説明が求められる状況になりつつある。

図1:SAS規格のHDDとTLC NAND規格のSSDの容量単価分岐点の推移と予測(出典:SNIA、ネットアップ)

ストレージ分野でのAI活用

 Part1で述べたように、現在では新たにAI(人工知能)の文脈で、マシンラーニング(機械学習)やディープラーニング(深層学習)が多くの企業で取り組むべきテーマとして浮上してきている。その結果、データの格納・管理を司るストレージについても、今日のAIの進展を踏まえてあらためて考え直す必要がありそうだ。

 AIの発展によって、大量のデータから学習することで新たな知見を得てビジネスに生かすことに取り組むユーザーが増えている。ここで問題になるのは、学習用の大量のデータをどこから持ってきてどこに置くかという点だ。AIの実用化段階で注目された画像解析や音声認識、自然言語処理などでは、インターネット上に存在する膨大なデータが学習用サンプルとして活用された。インターネットが単なる通信網ではなく、膨大なデジタルコンテンツの集積場として機能するようになったことで、大量のデジタルデータが利用可能になり、それがAIの発展に大きく寄与したという流れだ。

 こうした「インターネット上にあるデータを巧みに使う」タイプの処理は今後も重要な役割を担い続けることになるだろうが、一方で多くの企業が現在取り組んでいるのは、「自社で保有する/自社にしか存在しないデータ」の活用だろう。この場合、ストレージの問題が密接に関連することになる。

階層化ストレージの今後

 安価だが遅いメディアで容量を稼ぎ、高速なアクセス性能が必要なデータは高価だが高速なメディアを少量用意してそこに格納する、というのが階層化ストレージの基本的な考え方だ。

 標準的には3階層の構成をとり、データへのアクセス履歴をストレージシステム側で管理して、アクセス頻度に応じて階層間を自動的に移動することで運用管理負担なしに最適なデータ配置を実現する仕組みだ(図2)。そして、実際のユーザーはこの仕組みをさらに拡張し、滅多にアクセスされないデータは“アーカイブデータ”としてテープストレージなどに移動しておくかたちで大量データ保持とストレージコスト削減の両立を図っている。

図2:アクセス頻度に応じたストレージ自動階層化のイメージ(出典:富士通)

 今、こうした階層化ストレージの考え方にも転換が迫られつつある。SoR(Systems of Record)系の代表格として、ERPなどの基幹業務アプリケーションのデータを考えてみよう。

 企業の会計情報などを中心としたデータは、基本的には当該年度の決算が終わればほぼ役割を終える。もちろん、企業の活動記録として長期保存が求められるし、取引の経緯などを後から確認するなどのアクセスもあるだろうから、当該年度のデータはアクセス速度が速い階層に、決算後数年はアクセス頻度が低いデータとして安価なストレージ階層に置き、最終的にはオフラインのアーカイブデータとして長期保存するという具合に、階層を下がっていくライフサイクルで管理される。

 会計データの場合は、事後もそのままの管理体制で問題ない場合が多いが、例えばコンシューマー向けのオンラインショッピングサイトで顧客の購買傾向を知るために過去の購入履歴をAIに学習させるなどのニーズが生じるかもしれない。

 この場合、何年前まで遡ればよいのかという問題があるものの、アーカイブからデータを掘り起こしてオンラインに戻すことになる可能性も高い。そして、こうした処理が拡大するにつれて、そもそもデータをアーカイブに移すこと自体が合理性に欠けるという実感も生じてくる。

 もちろん、ありとあらゆるデータをすべてオンラインに残しておくというのはストレージ容量がいくらあっても足りない。一方、アーカイブからの出し入れにも時間やコストを費やすことになる。最終的にはバランスの問題になるが、データ活用が企業の競争力を左右するという認識が広まった現在、分析用にオンラインに残しておきたいデータの量はこれまで以上に増大する傾向にある。

 階層化ストレージは、上述したようにそもそもは低速なHDDでコストパフォーマンスを最適化するための工夫で、高速なSSDで構成されるオールフラッシュストレージでは階層化の必要はない。HDDと組み合わせて、フラッシュを最高速の階層と位置づける構成はありえるとしても、オールフラッシュの内部にアクセス速度の異なる階層を複数設定する意味は希薄だ。

 むしろ、データ圧縮や重複排除を活用して容量単価をHDD以下に抑えられれば、可能なかぎりのデータをオールフラッシュストレージ上にフラットに展開しておいて学習でも分析でも自在に活用できるようにしておくほうがより大きな価値を引き出せそうだ。

 現実はさらに複雑で、アーカイブデータの格納に関しては適切な暗号化などの処理を行ったうえで、クラウド上のオブジェクトストレージに置くという手もある。クラウド事業者側で設定される料金体系次第だが、単に大量データを静的に保持しておくだけならば、相当に安価に利用できる。一方、データの入出力が頻繁に発生するようだと、トラフィック課金などが設定されている場合にはオンプレミスのほうが安くなることもありえる。

 さらに、保存期間が長期になると累計コストがオンプレミスを上回る分岐点を越えてしまう可能性が出てくることもにも留意しつつ、最適な選択肢を選ぶことになる。とりあえず、頻繁にアクセスされるデータに関してはクラウドよりもオンプレミスのストレージのほうが使い勝手とコストの両面で有利になる場合が多い。

 AIの活用を念頭に置いて自社データの格納のためのストレージを考えるのであれば、今後はフラットな構成のオールフラッシュストレージで十分な容量を確保することを検討すべきではないだろうか。

フラッシュをさらに高速にするNVMe-oF

 上述のピュア・ストレージは、2018年5月下旬に米国で年次のユーザーコンファレンス「Pure//Accelerate 2018」を開催した。4月に発表したAI処理用アプライアンス「AIRI」(写真2)が注目された同社だが、一方で、ストレージ自体の新たな技術コンセプトとして「データセントリックアーキテクチャ(Data-Centric Architecture)」を打ち出した。

写真2:ピュア・ストレージのAIアプライアンス「AIRI」。エヌビディアのDGX-1とピュア・ストレージの「FlashBlade」を組み合わせて構成された製品だ

 データセントリックというと、ITインフラ分野では主にデータの移動が最小になるようにプロセッサを配置して処理を行うサーバーのアーキテクチャを指すことが多い。ピュア・ストレージのデータセントリックアーキテクチャを考えるときは、その意味からは離れたほうがよいだろう。

 同社のデータセントリックアーキテクチャの基本的なアイデアは、現在、仮想化プラットフォームのためのストレージとして使われている共有型のSAN/NASと、新しいスケールアウト型のプラットフォームとして使われ始めたDAS+SDSによる分散型ストレージのいいとこ取りを目指すというものだ。

 同社のオールフラッシュストレージ製品の中で旗艦モデルと位置づけられる「FlashArray//X」は100%NVMeを謳い、内蔵ストレージメディアをNVMe対応フラッシュモジュール構成としている。さらに、今回のアップデートではNVMe-oF(図3)のサポートも追加された。

図3:NVMe-oF の概念図(出典:米メラノックステクノロジーズ)

 NVMe-oFは、Non-Volatile Memory Express over Fabrics)の略で、本来はサーバーのプロセッサ直結型のPCIxバス接続NVMeデバイスにネットワーク経由でアクセスするための仕様だ。現時点でのFlashArray//Xでは50GbpsのEthernet接続をサポートしており、高いパフォーマンスを実現できるものと期待される。

 こうしたストレージを前提とすれば、上述した階層型ストレージの仕組みはますます不要なものとなり、どのようなアプリケーションに対しても単一のストレージプールで対応できるようになる。SDSベースのストレージシステムとして柔軟な拡張性を備え、運用管理の負担も大幅に軽減される。

 データセントリックアーキテクチャの目指すところはシンプルで、これまでのサイロ化されたストレージシステムを単一の共有ストレージインフラで置き換えてしまうというものだ。サーバー仮想化が普及し始めた時点から、共有化されたリソースプールから動的に必要なリソースを切り出して利用するというアイデアは繰り返し語られているわけだが、現実にはサイロ化されたシステムがいまだに残っている。

ストレージ運用管理の統合を目指して

 SDSを活用した統合インフラとしては、ハイパーコンバージドインフラストラクチャ(HCI)も普及し始めているが、一方でHCIのシステム単位でサイロ化が生じるなど、笑えない問題も出てきているようだ。

 どうしてもサイロ化が解消できない理由は何か。端的に言えば、あらゆる用途に対応できる統合インフラを構築する困難さに比べると、それぞれの要求仕様に応じたシステムを個別に構成し、複数システムを管理する負担を背負うほうがマシだと考えるIT部門が少なくないからだろう。

 そこで、NVMe-OF対応の分散型オールフラッシュストレージを使えば、パフォーマンス面では統合ストレージインフラとして利用可能かもしれない。だが、個々のアプリケーションの要求にきめ細かく応えられるのかどうかはまた別の話となる。

 例えば、バックアップやリストアの要件やQoS(サービス品質)に対する要求などがアプリケーションごとに違ってくるわけだが、特に日本国内で一般的なシステム構築手法では、要求しようとしてまとめて提示しておけばあとはシステムインテグレーターが最適化な構成でシステムを準備してくれるわけで、話がシンプルだ。

 一方、共通化されたストレージインフラを構成し、その上に新たなアプリケーションを載せる場合、アプリケーションの仕様に合わせてストレージプールから容量を切り出すのはともかく、切り出された区画に対して適切なQoSを設定し、アクセス制御やセキュリティ、バックアップやミラーリングなどのさまざまな設定を行う必要が出てくるが、その作業を社内のストレージ運用管理担当者が実施できるのか、という問題が出てくる。

 ストレージベンダー側からの支援としては、洗煉された高機能な運用管理ツールによって運用管理者の負担を軽減し、直感的な操作で必要な設定を容易に実現できるようにしていくことになるだろう。もちろんユーザー側でも運用管理体制の見直しや、もっと根源的な文化/意識の改革と言った取り組みが必要になるかもしれない。