Infostand海外ITトピックス

世界を止めたAWS障害 技術的問題の裏に「組織的知識の喪失」

組織的知識の喪失

 今回の障害でもう1つ注目されたのが、人材流出の影響だ。The Registerに寄稿したThe Duckbill Groupの主席クラウドエコノミスト、Corey Quinn氏は「組織的知識の喪失」の問題を指摘している。異常の認知から問題特定までに「75分かかっており、これは受け入れがたいこと」と批判する。

 Quinn氏が懸念するのは、長い時間をかけて構築されたAWSシステムを熟知する人材の不在だ。「『このシステムがおかしくなり始めたら、予期せぬことが起こる』ということを覚えている者はどこにいるのか?」と問いかける。

 Quinn氏は人材流出を裏付けるデータとして、次のような情報を挙げる。Amazonが2022年から2025年にかけて、全体で2万7000人以上の人員を削減したこと。さらに、全雇用レベルの「望まれない離職」(regretted attrition)の率が69%から81%もあるということだ。これは「辞めてほしくない人材が辞めていることを意味する」と述べている。

 また、元AWSシニアエンジニアのJustin Garrison氏のブログ投稿も紹介している。Garrison氏は2023年末に退職したあと、AWSを痛烈に批判していた。驚くべきは、その中で「2024年に大規模な障害が発生するだろう」と予測していたことだ。Garrison氏の予測は1年遅れで的中したことになる。

 そして、Quinn氏の警告は続く。

 「DNSの機能を深い技術レベルで説明できる非常に優秀な人を雇うことはできる。しかし、
DNSの変調に続く危機を察知できる人材を新たに雇うことはできない」。