イベント
クラウド運用のリアルに迫る――、「Cloud Operator Days Tokyo 2020」基調講演レポート
クラウドインフラ運用技術者のための年次カンファレンス
2020年7月31日 00:00
クラウドインフラ運用技術者のための年次カンファレンスイベント「Cloud Operator Days Tokyo 2020」が、7月29日~30日にオンライン開催されている。
昨年まで「OpenStack Days Tokyo」の名前で開催されていたイベントの後継となる。今回のテーマは「クラウド運用のリアルに迫る」。クラウドインフラ自体の運用からクラウド上での運用まで、「運用者の泥臭い経験を共有する」ことを目的とし、さらに人や組織にもフォーカスをあてている。
ここでは初日の7月29日の基調講演をレポートする。
オープンインフラの10年の成長とこれからの10年
この日は2つの基調講演が行われた。1つめの基調講演は、OpenStack FoundationのCOOのMark Collier氏による「境界のないコラボレーション:オープンインフラの夢を現実のものに」だ。
Collier氏は、OpenStackが2010年にリリースされてから10年ということで、これまでの10年とこれからの10年を語った。
OpenStack Foundationからリリースされるソフトウェアは、IaaSのOpenStackに始まり、仮想マシン型のコンテナ技術のKata Containers、テレコム業界から生まれたAirship、エッジコンピューティングのStarlingX、CI/CDのZuulなどへ、この10年で広がってきた。
OpenStackのコミュニティは現在、10万人以上のコントリビューターがいて、195カ国からの参加がある。692組織の参加と68のスポンサー企業があり、日本からはNECや富士通、日立、NTTなどが参加している。
Collier氏は「オープンソースのインフラの今後10年を理解するために」として、このような成長の背景を語った。
まず、ビジネスが技術インフラに依存するようになって、技術インフラがますます重要になっている。そして、クラウド技術に誰でもアクセスできることが重要になっている。そこで、オープンソースで皆が技術インフラへのアクセスが実現できる、というのがCollier氏の主張だ。
こうして、本番環境で動くソフトウェアを作るコミュニティができた。OpenStack Foundationが大事にしている概念としてCollier氏は「Open Source(オープンソース)」「Open Community(オープンなコミュニティ)」「Open Development(オープンな開発)」「Open Design(オープンな設計)」の“4つのオープン”を挙げた。
また、OpenStack Foundationではプロジェクトに対し、コミュニティのマネジメントやマーケティング、インフラなどをサポートしていることもCollier氏は紹介した。
OpenStack Foundationではイベントの開催や支援もしている。Open Infrastructure Summit(旧OpenStack Summit)や、開発者会議のOpenDev、あるいは今回のCloud Operator Daysなどだ。
OpenDevは、直近では6月29日から7月1日までバーチャルで開催された。参加者数は増えており、70カ国以上から、過去最大の800人以上が参加したという。
OpenDevで発表された事例として、Collier氏は、ゲーム会社のBlizzard Entertainmentや、通信会社のVerizon、ボストンの大学や企業による研究プロジェクトOpenInfra Labsの3つを紹介した。
Blizzard Entertainmentは、アクセスのスパイクにOpenStackで耐えるためのいくつかの課題を提案したという。Verizonはテストの重要性、特にテスト環境を本番環境と同じにするために、本番環境から切り出してテスト環境を作ることが語られたという。OpenInfra Labsからは、分散ストレージのCephのアップグレードや、利用の追跡、OpenStackとKubernetesとの組み合わせ方などが挙げられたという。
ここまでが、これまでの10年だ。続いてこれからの10年のオープンインフラ技術についてCollier氏は論じた。
まず、オープンソースが増える。これは課題でもあり、組み合わせや、国をまたいだ連携が重要になるという。
続いてハードウェアの多様化。GPUやFPGAがAIで使われ、ARMがデータセンターで使われるようになっている。そしてそれを支えるツールも整備されてきている。
次にデプロイの多様化。データセンターのほか、エッジやIoTなど、さまざまな形態の先にデプロイされる。
政府によるデータ主権やプライバシーの要求も重要になってきている。
「これらを解決するために、われわれはグローバルな協力によるオープンソースで技術インフラを作りアクセスできるようにしていく必要がある」とCollier氏は語り、「この場で多くの人と情報を共有してください」とまとめた。
楽天モバイルを支える運用組織作り
2つめの基調講演は楽天モバイル株式会社の小杉正昭氏による「楽天モバイル「完全仮想化の裏側」」だ。
小杉氏は、“完全仮想化による新規モバイル通信事業者”という新規事業の運用組織を、新規技術によってどのように作ったかといった、組織作りについて語った。
まず前提として、“テレコムの仮想化”を説明している。テレコム設備を仮想化する意味としては、専用装置より安価な汎用サーバーで実現する「CAPEXの削減」と、オペレーションをシンプル化して自動化する「OPEXの削減」を小杉氏は挙げた。
楽天モバイルでは、最初からすべてを仮想化する完全仮想化をとっている。仮想化した基盤は、東西に2つある基幹通信網の「中央DC」と、日本全国にある無線基地局の「地域DC」の2種類からなる。
ここではQCD(Quality、Cost、Delivery)として、キャリアグレードの品質、完全仮想化による大幅なコスト削減、圧倒的なスピードが求められる。
そのための組織の課題としては、技術と作業の属人化と、テレコム仮想化のエンジニアの人材不足の2つを挙げ、作業を平準化してスケールできる組織にしたいと述べた。
また、楽天モバイル独自の課題としては、初めてのシステムで仕様変更もあるという、変化への対応がある。
これらの課題に対して採った組織づくりの解決策を、小杉氏は説明した。
Step 1は、反省会による現状把握。足りていない人材を明確化するために、役割を4つに分けてみたところ、「構築する人」が圧倒的に足りないことがわかった。そこで、構築プロセスを見直して最適化し、さらに自動化することを考えた。
Step 2は、組織の立ち上げ。「構築する人」へのトレーニングとして、プロセスを書き出して旧プロセスで実際に構築し、そこから自動化するという段階をとった。旧プロセスから始めることで、技術の底上げと継続的な改善を期待したという。
Step 3は、変化に対応できる組織にすること。この変化には、仕様変更や問題発生などがある。同社では、独自の構築管理システムとフローを作り、仕様変更や問題発生に対する改善のループを設けた。
さらに、このフローについて、マネジメントである小杉氏が気をつけているポイントとして、「作業をお願いするのではなく、目的を達成するためのお願いをする」ことにより、背景と目的を全員で共有することを語った。
「プロアクティブな改善と、感謝しあい、励ましあう組織ができたのが、私の一番うれしいことだ」(小杉氏)。