ニュース
広域災害に対応するクラウド基盤構築に向けて~クラウドネットワークシンポジウム2013
(2013/2/25 14:57)
総務省の「広域災害対応型クラウド基盤構築に向けた研究開発」の成果報告の場である「クラウドネットワークシンポジウム2013」が東京・秋葉原で2月20日に開催された。
「広域災害対応型クラウド基盤構築に向けた研究開発」は、企業ではNTT、NTTデータ、NTT Com、NEC、KDDI研究所、日立、富士通、沖電気、大学では東京大学、慶応大学、奈良先端大らが研究開発を受託。OpenFlowなど最先端技術も使って、広域災害に耐え得るクラウド基盤を構築するためのクラウドサービス制御技術などの開発および実証実験を行った。
ここでは、展示およびデモの概要をお伝えする。
高信頼な社会インフラを実現するインタークラウド技術
NTT、東京大学生産技術研究所、NTT Com、NTTデータのプロジェクトで、実証実験の回線には情報通信研究機構(NICT)のJGN-Xを利用。広域災害や大規模故障の発生時に、複数クラウド間にまたがって自律的にサーバーとネットワークが連携してクラウドリソースを再構成し、スケールアウトすることでサービス品質を維持する基盤連携技術の実証を行った。
会場デモでは、東北クラウド(仙台)、関東クラウド(東京)、九州クラウド(博多)を使い、例えば東北クラウドのサーバー負荷が高まった場合に、関東や九州のクラウドに自動的に仮想マシンが増設され、スケールアウトすることで負荷が分散される様子を見せた。
NTTはクラウドをまたいでクラウドの制御と監視を行うためのインタークラウドインターフェイスなどを担当。インタークラウドのインターフェイスについては勧告草案Y.ccicを立ち上げ、GICTF(グローバルクラウド基盤連携技術フォーラム)において災害時のクラウド連携を意識した連携パターンや機能要件などの標準化作業を進めている。階層型リソース連携を実現するため、ITU-TのSG13 WP6でのインタークラウド技術の標準化作業においても草案作成を行っている。
東京大学 生産技術研究所は、サービスに必要なリソース量を計測、需要に応じて必要となるリソース量を高い精度で推定する「クラウドリソース要件解析技術」をもとに、SLA(品質保証制度)の担保が可能なリソースプランを作成する「RAO(Resource Allocation Optimizer)」を開発した。
NTTデータは、コンピューティングリソースをクラウドシステム間で動的に割り当てる技術の研究開発を担当。仙台、東京、福岡のクラウドで仮想マシン1000台規模での実証を行った。従来はクラウド間のスケールアウトを自動的に行うことはできなかったが、全体の制御を行うNTT開発のシステムの負荷監視機能と連動して、システムの動的再構成技術によりクラウド間をまたがるスケールアウトの自動化を実現している。
NTTコミュニケーションズは、エンドトゥエンド仮想ネットワークを迅速かつ柔軟に構成するネットワーク制御技術の研究開発を担当。仮想ネットワークを制御するためのAPIを他システムへ提供し、システム構成の変化に追従するネットワーク制御を実現した。仮想ネットワークAPIの監視機能を実装したことで、エンドユーザーからシステムへの遅延など通信状態の監視も可能にしている。また、仮想ネットワーク接続機能のIPv6拡張も実施。IPv6で構成された広域テストベッド環境においても仮想ネットワーク制御の実証を行った。
またNTTコミュニケーションズは、NECと共同研究で、エンドトゥエンドの仮想ネットワーク技術と、クラウド間ネットワークを制御するOpenFlow技術との連携による高信頼化手法のデモを実施。NTTコミュニケーションズが仮想ネットワーク技術を、NECがOpenFlow技術を担当し、APIを用いた連携によって、クラウド間を接続するオーバーレイネットワーク生成の際に、エンドトゥエンド通信に適したアンダーレイネットワークを生成する制御、および必要に応じアンダーレイネットワークの経路を再構成する制御の実証実験を行った。
ネットワーク・サーバー連携によるスケーラブルサービス制御技術のデモ
KDDI研究所、NEC、東京大学はネットワーク・サーバー連携によるスケーラブルサービス制御技術のデモを行った。NECとKDDI研究所は、経路制御や暗号化など、クラウドサービスごとに異なる経路制御方法やネットワーク処理を配備したネットワークを提供する通信事業者側の開発を担当。東京大学は、クラウドサービス提供者が提供するキャッシュや変換処理などの機能を配備し、サービスに最適なネットワーク構築を可能にする技術開発を担当した。
デモでは、災害などによる拠点の障害や過負荷が起こった際に、ネットワークとサーバーが連携してスケーラブルなサービス制御を行う実証デモを披露。仙台・東京・博多のクラウドをOpenFlowで制御、サーバーの突然停止に対応してサービス処理を余力のあるサーバーへ移動するデモを行った。サービス処理の状態保存により、サーバー停止後も処理移動を可能にし、拠点レベルの障害にも直ちにサービス処理を移動する。また、平常時の夜間などはサーバーへのサービス処理を最適収容し、不要な電力消費を抑える省電力機能も実装。
膨大な数のサービス処理とその通信の識別を可能にするネットワークノードの開発と、通信の最適収容を可能にサービス処理通信の経路制御により、非常時にも安定したサービス提供を行うことを可能にする。
また、AR技術を取り入れたサーバー監視も合わせてデモ。仮想マシンを収容したサーバー機の前面に識別用のマークをプリントした紙を張り、サーバー機を監視カメラでリアルタイムに撮影。タブレットアプリで監視カメラの映像にカメラを向けると、サーバー機の映像に、実際の処理の負荷状況を示すグラフや数値が吹き出しのように表示される。
ユーザーのタグ付けにより経路制御や高度パケット処理を可能にする「OpenTag Switch」
東京大学 情報学環 中尾研究室は、OpenTag Switch Logicのソフトウェア実装を行った10ギガビットイーサネット(GbE)を展示。災害情報映像の配信サーバーからのパケットにユーザー装置でOpenTagを付加すると、OpenTag Switchがパケットに付加したOpenTagに基づいて経路を選択。また、OpenTag Switchでは災害情報映像のトランスコード処理も行い、災害による狭帯域・輻輳状態でも情報配信が可能だという。利用には災害情報映像の送出側・受信側双方にOpenTag Swichを配備する必要がある。
◇The Click Modular Router Project
http://www.read.cs.ucla.edu/click/click
サービス品質保証型の省電力クラウドシステム技術など
省電力化と高信頼性も大きなテーマとなっており、日立、富士通、慶応義塾大学SFCは自律的な省電力制御によるサービスの利便性を維持したクラウドシステムの構築のデモを行っていた。仙台、東京、神奈川のデータセンターで、サーバーリソース適正配置とネットワークリソース適正配置の連携制御を行う。
デモは復興後のサービス再立ち上げ時のトラフィック増加を想定。広域データセンターで処理を分担し、クラウドの電力消費が増加することになるが、(1)処理負荷の減少時にサーバーリソースを片寄せすることで、低消費電力サーバーへ集約すると同時に、余剰サーバーの電源断、(2)トラフィック変化に追従したネットワークトポロジの適正化、(3)マッシュアップサービスの省電力化ルーティングを行う実証デモを行った。
開発にあたり、最適な省電力ネットワーク構成を導き出す設計技術、トラフィック変化に追従した省電力化を可能とする分散制御技術を富士通が担当。データセンター間で、サービスを提供する仮想マシンおよびネットワークの負荷に基づいて要求性能を維持しながら省電力を実現する技術を日立が担当。サービスレイヤーのトポロジーを生成し、マッシュアップサービスを提供する省電力サービスルーティング技術を慶応義塾大学が担当した。
このほか、NEC、沖電気、奈良先端大が「広域アクセスネットワークの省電力化・高信頼化技術」をデモ展示。公共の場所や学校などに設置した放射線測定器のセンサーの省電力化、広域アクセスネットワークの省電力化、省電力マルチホップ方式によるスリープ制御の最適化技術、通信管理サーバーにおける暗号通信路確立代行技術などの技術開発と実証実験について展示を行っていた。
また、日立製作所と富士通は、東北地方自治体がクラウドを用いて、各種センサーで収集した防災情報を東北ユーザーへ提供する社会インフラサービスを想定し、東北のデータセンター2拠点、関東のデータセンター1拠点をつないでデモを行った。
デモの内容は、平常時と復興時は東北の2拠点間でサービスを提供する仮想マシンの配置を適正化し、省電力化を実現。東北2拠点が被災した場合に、関東へ動的にデータセンターを再構築し、メトロ網通信路を確立し、緊急性の高い避難誘導情報を含む防災情報サービスを継続提供するもの。被災時に地元のデータセンターがダウンしても、関東でデータセンターを再構築して通信網を確立することで、避難に必要な道路交通情報や避難場所などの情報の継続利用を可能にするための実証実験となっている。
日立はまたリアルタイム性が要求されるセンサー処理を、ネットワークに分散配備したインテリジェントノードで処理することで、10ミリ秒オーダーの高速応答を実現する、リアルタイムネットワーク分散処理技術を展示した。