ニュース
クラウドインフラ運用技術者のための年次イベント「Cloud Operator Days Tokyo 2023」の見所を紹介
8月21日から9月14日までオンライン開催、最終日にはクロージングイベントをオフラインで
2023年7月24日 06:15
クラウドインフラ運用技術者のための年次カンファレンスイベント「Cloud Operator Days Tokyo 2023(CODT2023)」が、8月21日から9月14日まで開催される。今回のテーマは「運用の新時代 ~Effortless Operation~」。
イベントでは、8月21日から2週間、オンラインセッションをオンデマンドで配信する。そして9月14日にクロージングイベントをオフラインで開催する。なお、オンデマンド配信されたセッションは、10月以降にアーカイブ配信予定。
参加費無料の事前登録制で、申し込みは7月下旬にWebで受付開始予定。申し込み締め切りは9月14日の10:00。
CODTは、クラウドシステムの運用者に焦点をあて、運用者が日々取り組んでいる新しい挑戦、成功・失敗体験、得られたノウハウなどを分かち合い日本のオペレーターの底力を高めることを目的とする技術イベント。もともとOpenStack Days Tokyoの名前で開催されていたイベントの後継で、CODTの名称で開催するのは4回目となる。
7月20日には、CODT2023開催の概要や見どころについて記者説明会が開催された。また、2月に開催されたオフラインイベント「CODT Unplugged2023」の開催報告や、カナダで開催された「OpenInfra Summit Vancouver 2023」の参加報告、さらには株式会社デンソーでのITサービス内製化と人材育成に関する講演も行われた。
オンラインのオンデマンド配信と、リアルのクロージングイベントを実施
CODT2023の概要と見どころについては、水野伸太郎氏(日本OpenStackユーザ会 会長/日本電信話株式会社)が解説した。
6カテゴリーのセッションから見どころを紹介
今回のオンラインセッションは6カテゴリー構成で、7月20日時点で49セッションが採択されている。セッションのアブストラクトのキーワードを分析してみると、「運用」「クラウド」「Kubernetes」といった定番に加えて、今回は「AWS」「セキュリティ」なども目立ったという。
その中から水野氏がカテゴリーごとにピックアップしたセッションを紹介した。なお、紹介時点では実行委員も内容を知らず、タイトルとアブストラクトだけの情報からの紹介だという。
「運用苦労話(しくじり、トラシュー)」には9セッションが予定されている。大手インフラ事業者からユーザー企業までが並んでいる。その中から水野氏はヤフー株式会社の「大規模プラットフォームの無停止アーキテクチャ刷新から学んだ、運用ナレッジを開発に還元することの大切さ」と、GMOペパボ株式会社の「マルチクラウド運用におけるKubernetes: GKEとプライベートクラウドの特性を活用した成功事例」を取り上げた。
ヤフーのセッションは、過去の事故や運用のナレッジをベースにサービス無停止で一部システムを刷新した話となっている。またGMOペパボのセッションは、GKEとプライベートクラウドを、それぞれの特性を生かして組み合わせた話となっている。
「運用自動化(Dev/Ops、CI/CD、IaC)」は最大の15セッションが予定されている。その中から水野氏は株式会社スリーシェイクの「SREからPlatform Engineerへの拡大」と株式会社スクウェア・エニックスの「クラウドネイティブ活用でちょっと手にあまる規模のサーバーを効率的に管理しよう」を取り上げた。
スリーシェイクのセッションは、SREとPlatform Engineerの違いや共通点についての話となっている。またスクウェア・エニックスのセッションは、仮想マシンを多数運用している中の悩みや効率的な管理についての話となっている。
「監視・ログ・オブザーバビリティ」は10セッションが予定されている。その中から水野氏は、株式会社ジェーシービーの「クレジットカード会社が取り組んだ、リモート運用の仕組みをセキュリティ規定に準拠しつつ実現した話」と、株式会社セブン銀行「全面的に動的閾値監視(Anomaly Detection)を採用して分かったメリットデメリットについて」という、金融分野の2つを取り上げた。
JCBのセッションは、クレジットカード会社のアプリケーションをGCPで動かしている話に、特にオブザーバビリティの仕組みをまじえて話す。セブン銀行のセッションは、重大な問題が起こる前に普段と違う挙動を発見するアノマリー検知を、大量の誤検知が発生しないように設定した苦労話やノウハウを話す。
「OpenStack」は、CODTで久しぶりにカテゴリーが設けられ、今回4セッションが予定されている。その中から、LINE株式会社の「A beginner's journey of operating production-level Private Cloud using OpenStack」と、OpenInfra Foundationの「The LOKI Stack: Linux OpenStack Kubernetes Infrastructure」を取り上げた。なお両方とも英語セッションとなる。
LINEのセッションは、OpenStackを導入してプロダクション運用している経緯や、NovaやNeutronの機能開発、OpenStackのアップグレードなどについて話す。OpenStackを開発するOpenInfra Foundationのセッションは、LOKI(Linux, OpenStack, Kubernetes Infrastructure)、つまりLinux・OpenStack・Kubernetesの組み合わせの隆盛について話す。
「コスト管理」は7月20日時点で予定されているのは1セッション。東日本電信電話株式会社の「タグ!タグ!タグ!AWSリソースへのタグ自動付与による、ちりも積もれば山と“せぬ”コスト削減の術~」は、社内でそれぞれ自由にAWSを使っているとコストが高くなるのを、いかに軽減したかについて話す。
「パブリッククラウド運用」は10セッションが予定されている。水野氏は、1つめとしては全体の中で半分がセキュリティや権限管理のセッションであることを取り上げた。もう1つとしては、エクイニクス・ジャパンの「急ぎでシステム構築するその前に!統制のとれたCloud運用設計」を取り上げ、全体最適運用の設計について話すと紹介した。
9月14日にオフラインでクロージングイベント開催
そして9月14日には、お台場の「@docomo R&D OPEN LAB ODAIBA」にてオフラインでクロージングイベントが開催される。キーノートとしては、ぐるなびによる「ぐるなびが考えるAIOps成功への道(仮題)」と、OpenInfra Foundationによる講演を予定している。
また、セッションを表彰する「輝け! クラウドオペレーターアワード」表彰式や、参加者をまじえて議論するアンプラグドセッション、スポンサー展示なども予定されている。
全員参加で議論したイベント「CODT Unplugged2023」開催報告
CODT2023に先立ち、2月にはイベント「CODT Unplugged2023」が開催されたことについても報告がなされた。完全オフラインで、100名以上が参加。モデレーターとセッションリードが中央にいて、れを参加者が囲む形で全員が議論する「フィッシュボール形式」がとられた。
扱われたトピックは6つ。その中でも人気の高かった4つについて、水野氏が話題を紹介した。
「大規模障害でいま起こっている障害、そして戦い方(障害分析と対応、予防)」では、Microsoft社の大規模障害の経験に関する論文をもとに議論が行われた。参加者からは、外部の認証基盤など自分たちの所有物ではない部分が原因の場合についての問題提起などがなされたという。
「監視・ログ(ツール、コストなど)」では、SaaSの監視ツールについての議論が盛り上がったという。中でも、見やすいGUIの提供によって非エンジニアにも見てもらえるという話や、監視の監視が大変という課題などが話しあわれた。
「ベアメタル(いるいらない、結局どうなの)」は、物理サーバー利用に関する異色のセッション。高パフォーマンス・低レイテンシー・特殊なデバイスなどのニーズで必要になるケースの話や、ミッションクリティカル系でも使われるがクラウド以降も進んでいる話、OpenStack Ironicが使いやすくなっているという話などが出たという。
「最新技術座談会(最近入れたネタ、いい話、だめな話)」では、WASM・軽量VM・eBPFといったコンテナ関係の技術や、監視SaaSの障害の問題、カオスエンジニアリングなどについて議論がなされた。
OpenInfra Summit Vancouver 2023について参加報告
CODT2023実行委員長の長谷川章博氏(AXLBIT株式会社)と、CODT2023実行委員の谷野 光宏氏(LINE株式会社)は、6月にカナダで開催された「OpenInfra Summit Vancouver 2023」について参加報告した。
OpenInfra Asiaが設立、ただし日本からの参加は2社
OpenInfra Summitはもともと「OpenStack Summit」の名前で開催されていたイベントが名称変更したもの。OpenStack Summitを含めて今回が22回目の開催となった。
長谷川氏は、「かつてのOpenStack SummitはOpenStackをどう作るかが中心だったが、OpenStackが安定化してきたことにより、関連するOSSプロジェクトとも連携したSummitに役割が変化した」と説明した。
今回のOpenInfra Summitのトピックとして、欧州とアジアに地域のハブとなる「OpenInfra Europe」「OpenInfra Asia」ができたことを長谷川氏は紹介した。
このOpenInfra Asiaについて、長谷川氏は「個人的な分析」として、アジアから参加した23社のうち中国から13社が参加している一方、日本は2社の参加にとどまっていることを紹介。背景として、中国国内には米国資本のクラウドが入りづらいので中国国内のクラウドが作られることを挙げつつ、日本は米国の大手クラウドを使えるが「クラウドインフラの技術的な厚みで中国と差がついてしまうのも困るなあと思っている」として、CODTの意義をあらためて述べた。
Kataコンテナ、LOKI大規模運用、エッジクラウドの話題
OpenInfra Summitのセッションでの技術トピックについては谷野氏が紹介。特に、「Kata × Security」「Kubernetes × Deployment × LOKI」「StaringX × Edge」というキーワードの組み合わせで解説した。
まず「Kata × Security」。Kataは軽量ハイパーバイザーを使ったコンテナランタイムだ。現在の方向性としては、よりセキュアなコンテナランタイム「Kata confidential containers(Kata COCO)」を目指しているという。
谷野氏はKataコンテナを利用している企業のセッションとして、AlipayとMicrosoft Azureを紹介した。Alipayではパブリッククラウドでは信頼性のないワークロードの実行に、プライベートクラウドではパフォーマンスと障害分離のために利用しているという。またAzureでは、AKS(Azure Kubernetes Service)において、Kataコンテナによりホストや他Podから分離するPod Sandboxing機能のプレビューを提供している。
「Kubernetes × Deployment × LOKI」は、Linux+OpenStack+Kubernetesの組み合わせによる大規模運用の話だ。事例として、CERNが30万コア以上のクラスタを運用していること、China Telecomが700以上のデータセンターで運用していること、Bloogbergが40万コア・数百Kubernetesクラスタの規模で運用していることが紹介された。
「StaringX × Edge」は、エッジクラウドの話だ。StaringXにより、地理的分散を考慮してLOKIスタックを構築できるという。最近のStaringXについては、Sapphire Rapids世代のIntel Xeonの1コアで動作可能にする改善や、ARM社がStaringXに参加してvRAN・OpenRANについて検証していることが解説された。また、事例として、VerizonがStarlingX(商用版)を用いて5Gネットワークを構築し、1万を超えるサイトを運用していることが紹介された。
デンソーのITサービス内製化、クラウドネイティブ化、アジャイル開発を支える「DENSO cloud & agile dojo」
記者説明会では、株式会社デンソーでのITサービス内製化と人材育成に関する講演も行われた。
まず株式会社デンソーの成迫剛志氏(執行幹部 研究開発センター クラウドサービス開発部長)は、デンソーについて「伝統的大企業であり、製造業であり、堅い会社のイメージ」と紹介。その中でデザイン思考やクラウドネイティブ、内製化のアジャイル開発などを取り入れて「デジタルネイティブスタートアップのように、開発から運用まで全部やる」デジタルイノベーション室を2017年に立ち上げた。
開発したアプリケーションの一例としては、スマホで運転をスコアリングするアプリ「yuriCargo」を紹介した。運転の行動変容を起こすと同時に、集められたビッグデータからヒヤリハットの多い地点を割り出して自治体の交通安全施策に使われたり、イリオモテヤマネコの交通事故対策に使われたりもしているという。「イテレーションを回して開発しているからこんなこともできる」と成迫氏は説明した。
ただし、アジャイル開発体制(スクラム)においては、規模が大きくなると開発者育成が課題となることを成迫氏は指摘。そのために内製の育成プログラム「DENSO cloud & agile dojo」を実施していると紹介した。
DENSO cloud & agile dojoの内容については、校長を務める株式会社デンソーの小浜明日香氏(クラウドサービス開発部 デジタルイノベーション室 アジャイル開発課)が解説した。
DENSO cloud & agile dojoには、研修コースとブートキャンプコースがある。研修コースはソフトウェア開発者がアジャイル開発を体験する1週間のプログラム、ブートキャンプコースは開発未経験者を対象にしたクラウドサービスのリスキリングをサポートする2か月のプログラムだ。この講演では小浜氏はブートキャンプコースについて紹介した。
ブートキャンプコースでは、社内・グループからの参加者でチームを結成し、知識・技術を講義で学ぶだけでなく、モブプログラミング(複数人が1台のコンピュータに向かって共同プログラミングすること)なども実施。そして、チームでサンプルプロジェクトとしてサービスの企画から開発まで実践する。
もともと、体系立ったコースがなかったところから、体系を作り、チーム加入前の共通の教育を作り、講義内容もフィードバックにより即時改善していくといった形で、教育の仕組みをアジャイルに開発。講師は現場の開発者が業務として携わり、卒業生も講師にになりという形で規模を増やして、現在はグループ会社も含めて実施しているという。
ブートキャンプのサンプルプロジェクトから生まれた成果物の例として、「SOE.L(Sense Of Empathy + Live)」を小浜氏は紹介した。オンラインのプレゼンにおいて、話す側も聞く側も場の空気が分からないという課題に対して、匿名でコメントやフィードバックできるようにするものだ。
これは1週間で動くものができ、フィードバックを受けて1か月で試用できるまでに完成。現在、社内で活用されているという。
ここで再び成迫氏に交代。成迫氏はリスキリングの教育を作るのも開発であり、内製開発してフィードバックループを回すのが重要だとまとめた。
そして成迫氏はあらためて、トヨタ生産方式の二本柱である「ジャスト・イン・タイム生産方式(JIT)」と「ニンベンの付いた自働化(人の作業ではなく動作を機械に置き換える)」を取り上げて、クラウドインフラのJIT化・自働化にはInfrastructure as Code(IaC、インフラ構築をコード化して管理)が必要だと述べた。
デンソーではIaCのツールとしてTerraformを採用し、本番サービスから、開発・運用環境、DENSO cloud & agile dojoなどまで利用している。さらに、Terraformによるインフラ運用のトレーニングを「Terrakoya」の名で実施している。
IaCにより、コマンド一発で自動インフラ構築ができることや、後からでもコードを見れば構成が分かること、複数のプロジェクトに応用でき秘伝のタレ化を防げることなどをメリットとして成迫氏は挙げた。
「テック企業でない一般企業にとっては、アジャイル開発とその後の運用がキーになる。そのためにIaCが重要になる。クラウド企業でなくてもIaCを使いこなす必要がある時代なんじゃないかと思う」(成迫氏)。