Infostand海外ITトピックス
何が起こった? Googleパブリッククラウドの18分間のダウン
(2016/4/25 09:39)
Googleのパブリッククラウド「Google Compute Engine(GCE)」が、システムダウンに見舞われた。停止した時間は18分間で、全リージョンが停止するなどフェイルオーバーが機能しなかったことが明らかになった。クラウドの信頼性問題を蒸し返す形となり、新しいレベルの対策が必要という声も出ている。
全リージョンで18分間のダウン
「わずか18分」なのか、「18分もの間」なのか――。長さに評価は分かれるかもしれないが、「24時間365日」を前提とする企業のシステムを支えるには、決して軽くみることはできない障害だ。4月11日19時9分から27分(米太平洋時間)まで、GCEのインスタンスは全てのリージョンでダウン。GCEはGoogleのIaaS(Infrastructure as a Service)であり、同クラウド上でシステムを動かしていたユーザーは18分間の停止を余儀なくされた。
Googleのステータスページによると、ダウンする前の18時51分、東アジア1リージョンで「Cloud VPN」に問題があると報告している。その後、同リージョンの全てのCloud VPNトラフィックが影響を受けているようだ、とレポートした。そして19時21分、「全てのリージョンで深刻なネットワーク接続障害があるようだ」と報告している。問題解決を報告したのは19時45分。「19時27分には影響するすべてのサービスで解決した」としている。
このシステム障害はニュースとしては、それほど大きく取り上げられなかったが、GCEの顧客にはBrightCove、HTC、DataStaxなどもいる。「Googleの検索、地図、メールなどの通常のサービスに影響しなかったので、世紀末のような騒ぎにはならなかったが、こうした大規模な障害は大きな打撃だ」とBusiness Insiderは指摘する。「重要なのは、これがGoogleだったということだ。20分近くダウンするなどという事態は起こるべきではなく、Googleにはそれを防ぐためのシステムとバックアップシステムが整っているはずだ」とした。