クラウド&データセンター完全ガイド:特集

本格稼働するオブジェクトストレージサービス

容量無制限のスケーラビリティとデータセンター多重保存による耐障害性を装備――IDCフロンティア 分散ストレージサービス

IDCフロンティア 分散ストレージサービス

IDCフロンティア

 IDCフロンティアは「IDCフロンティア 分散ストレージサービス」(以降 IDCF分散ストレージ)を提供すべく、現在開発に取り組んでいる。IDCフロンティアが実現を目指している「インフラ構想」の要ともなる「分散ストレージ」の取り組みについて紹介したい。

分散ストレージの基盤

 IDCフロンティアでは、「将来のIT需要に備えた大容量、拡張性、広域分散を整備する」との考えから基盤を作ってきた。そのさきがけが、首都圏、北九州、白河の3拠点を中心とした3メガデータセンター。当初は首都圏を中心にデータセンターサービスを行っていたが、地震などの災害リスクや拡張性を考慮し、2008年10月に福岡県北九州市、2012年10月には福島県白河市で郊外型データセンターサービスの提供を開始した。これら郊外型データセンターを加えることで、インフラリソースを地域にバランスよく分散させ、次世代インフラに不可欠ともいえる「メガスケール」の実現を可能とした。

 さらに同社は2009年6 月よりコンピューティングを中心としたクラウドサービスを開始しており、現在は首都圏と白河に立地するEast(東日本)リージョンと北九州に立地するWest(西日本)リージョン、2つのリージョンと3つのロケーションでサービスを提供している(図1)。

図1 2つのリージョン・3つのロケーションによるサービス展開

 今回サービスがリリースされる分散ストレージは、データセンター、ネットワーク、クラウドコンピューティングサービスが各地に整備されている同社サービスのデータ保管を担う重要なサービスとして期待されている。

なぜ分散が重要なのか

 なぜIDCフロンティアは分散を重要視するのか、それは「インフラ領域でビジネスパフォーマンスおよび事業継続性レベルをリーズナブルに保つ」という考えからくる。

 たとえば、1カ所にデータやシステムが集中するということは、ビジネス継続上の大きなリスクとなる。しかしながら、単純に異拠点で冗長をすれば、コストは非常に大きくなる。同社では各種サービスを東日本、西日本から選ぶことで、必要なリソースだけを利用することができる。また、GSLBなどを利用することで、ふだんは両拠点を利用して、クライアントの方々の投資にかかわる稼働率を高める事例なども持っている。また、スマートフォンなどの利用拡大で、データの流通量が近年大幅に増加しているが、これらの要求に適切に対応するため、トラフィックやトランザクションが1拠点に集中するのでなく、トラフィックやコンピューティング処理することも分散の大きな目的である。

オブジェクトストレージとは

 サービスの詳細に入る前に、IDCF分散ストレージサービス基盤を支える、オブジェクトストレージについて説明しておこう。

 オブジェクトストレージについてはいろいろな説明・定義があるが、IDCフロンティアでは「HTTP経由で画像やログファイルなど静的なデータの読み書きをする、拡張性の高いストレージ」と考えている。大量のデータの読み書きと保管を行うため、一般に汎用的なIAサーバーを利用し、サーバーの追加でストレージの読み書き性能や容量が簡易に増強する構成をとっている。このため、一般的に専用のストレージと比べてコストを抑えることもできる。データベースのような,細かいデータの頻繁な読み書きは、一般的に得意ではないが、今後取り扱いが増大するであろう、スマートフォン上でやりとりされるような、動画や画像のような非構造データやシステムが出力するログデータなどの保存、出力にはコストや拡張性の意味で優れているケースが多い。

 いままで保存先に困っていた前述のデータを、必要な量だけいつでも保存、読み出しが可能になるため、今後活用の可能性はあるがすててしまったデータの保存、高価なストレージに保存していたデータ量の削減が期待できる(図2)。

図2 オブジェクトストレージ概念図

IDCフロンティア分散ストレージサービスとは

 IDCF分散ストレージは、IDCフロンティアが所有する国内複数の拠点と広帯域ネットワーク、米Basho Technologies社(以降Basho社)のRiakおよびRiak CSを用いたオブジェクトストレージサービスである。

 近年、企業やWebサービスで取り扱うデータが増大するなか、データをより安全かつリーズナブルなコストで保管、配信できることが重要になっている。同社のサービスでは、データセンターやネットワーク、クラウドコンピューティングサービスと同様、高い拡張性と安定した品質のサービスを国内複数個所にて提供することができる。現在は限定ユーザー向けにトライアル提供を実施しているが、今年秋には追加のトライアル受付を行う予定である。以下、本サービスの特長について紹介する。

特長1:日本をまたにかけたストレージ 東西2拠点提供(予定)

 IDCF分散ストレージは、Eastリージョン、Westリージョンとして国内の東西2拠点でサービスを提供する予定である。そのため、災害や障害などで万が一いずれかの拠点にアクセスができない場合でも、もう一方の拠点にデータを保存しておくことで、スムーズに対応することが可能となる。

 たとえば、ECサイトで使われる商品のサムネイル画像や動画配信サービスの動画保管先など、常に読み出しなどが発生するデータについては、データを両リージョンに保管し、ふだんはEastリージョンにアクセス、有事の際はWestリージョンにアクセスを振り替えることも可能だ。切り替えについては、GSLB(Global Server Load Balancer)サービスと組み合わせることで、自動切り替えを行うこともできる。保管するデータの可用性(アクセスできる確率)を高く設定する必要がある場合は、ぜひご検討いただきたい。

 また、首都圏や東日本でシステムを持つ方には、データの遠隔保存策としてWestリージョンにバックアップデータを保管するなど、東西のリージョンを利用したデータ退避を実現できる(図3)。

図3 東西分散しているIDCF分散ストレージ概念図

 なお、各リージョンでは、データを異なる3つのホストに保存(3多重保存)し、仮にホストの故障などが起こった場合も、同じデータを持った他のホストが応答することによって、データへのアクセスが保障される。交換用のノードが適用されると、他のノード上のデータから交換したノードにデータが再生成され、常に3多重の状態になるように動作するようになっている。

 IDCF分散ストレージは、広帯域の回線と大容量のストレージプール、そしてBasho社の分散技術によって、使い勝手はシンプルだが、信頼性の高い分散ストレージサービスを提供することが可能である。

特長2:閉域網接続で安心アクセス

 IDCF分散ストレージは、閉域網からのアクセスにも対応している。

 クライアント側の管理しているオフィスやデータセンターのIT資源の多くは、イントラネットに存在している。それらのIT資源がパブリッククラウドサービスと接続するには、インターネット経由でのアクセスが必要になり、セキュリティポリシー上、敬遠される場合がある。

 しかしながら、社内のデータ保管において、多くの方がバックアップサーバーやファイルサーバーの容量不足や追加コストの削減を課題にしている。

 同サービスでは、クライアントの閉域網を同社のデータセンターに延伸することで、インターネットを介さずとも社内ネットワークから直接ストレージにアクセスすることが可能となる(図4)。

図4 閉域網でストレージがつかえるイメージ
図5 ポータルのイメージ

 さらにTOKAIコミュニケーションズ(ソフトバンクテレコムでも対応予定)の閉域網をご利用中の場合は、最低契約期間1カ月でストレージへの接続が可能となっている。メンテナンスやサイト移設のためのデータの一時退避先としての利用、社内システムのクラウド化に備えた検証なども、低いリスクで実施することができる。

 なお、インターネット経由でSSL通信にも対応しているため、クライアントのセキュリティやネットワーク要件に応じて、最適な構成を選択することができる。

特長3:S3 APIへの高い互換性

 Basho社のRiak CSは、Riak上でオブジェクトストレージを実現するための基盤ソフトウェアで、Amazon Web Servicesの S3 APIと高い互換性を持っている。そのためS3を利用されている方は大きな変更なく、同社サービスを利用することが可能である(コラム参照)。

特長4:IDCFサービスとの親和性

 IDCF分散ストレージは、IDCFのコロケーション、クラウドサービスとの通信費用が無料となる予定だ。そのため、クライアントの方々は、データ転送料を気にすることなく、IDCFサービス上のシステムからのデータ保管が可能である。IDCFサービス間の通信は、自社の広帯域ネットワークを経由するため、通信のストレスも小さく、コストやスピードの面で、データを気軽に保管することができるようになる。

 また、IDCFクラウドセルフタイプと同じアカウント、ポータルから利用が可能なので、すでにIaaSサービスをご利用いただいているクライアントの方々はもちろん、これからご利用の方に対しても簡単にサインアップをして、ストレージとコンピューティング双方のサービスを利用することができるようになる。

最後に

 クライアントの方々が解決したい、ITにかかわる課題や欲しい機能は実にさまざまである。

 一方でインフラ特有の要素は、技術の進歩やクラウドサービスの普及に従い、最大限サービス提供者で課題をクリアして提供がされるようになってきている。

 同社は、大容量、拡張性、広域分散のテーマのもと、インフラの課題にサービス事業者として取り組みつつ、お客様の本質的な課題の解決に積極的にかかわっていっている。

 「お客様が実現したい世界を、“事業者”ではなく“パートナー”としてサービスを提供していきたい」これからも進化し続けるIDCフロンティアに注目いただきたい。

Basho RiakとRiak CS

 Riakは分散型Key Value Store(以降KVS)の1つで、Amazonで開発されたAmazon Dynamoの論文に触発されて生まれた、極めて拡張性の高いKVSである。

 高い拡張性を有する最も大きな理由は、KVSを構成する、多くのノードの中に、それを取り仕切るマスターノードがなく、どれも対等な立場で処理を行う設計にある。マスターがないため、処理が集中する部分がなく、ノードを増やすことで処理性能を拡張することができる点が、高い拡張性を持つ理由である。

 また各ノードが対等なため、ノード障害があった場合も故障したノードが受け持っていたデータの処理を他のノードが均等に分散して行うことができるため、ノード障害などの影響を受けにくい特長がある。

 Riakは、Erlangという言語で開発されている。Erlangはもともとエリクソン社が電話交換機用に開発したプログラムで、分散環境、耐障害性、無停止動作といった安定性と運用性を兼ね備えた言語である。

 Riak CSは、前述したRiakで構成されたKVS上で、オブジェクトストレージを実現するためのソフトウェアで、最大5TBのファイルサイズのデータを保存することが可能だ。

 RiakおよびRiak CSは各々の役割において、安定性とスケールを実現する仕組みになっている。データ爆発といわれるような将来の大量データも扱うことができるインフラサービスを提供するには、高い拡張性と運用性を備えるこの仕組みがIDCフロンティアには必要不可欠だった。

 IDCフロンティアが目指す方向性と親和性が高かったというのが、Riak/Riak CSの採用に至った理由である。

図6 Riak & Riak CSのスタック(出典:Bashoジャパン)
図7 Riak CSアーキテクチャ(出典:Bashoジャパン)