ニュース

KDDI、複数システムに関わる障害原因の迅速な特定を支援する「復旧支援AIエージェント」を運用開始

 KDDI株式会社は19日、クラウド環境上に構築されている、音声通話・データ通信やau PAYなど一部サービスにおける障害原因を特定する「復旧支援AIエージェント」の運用を開始すると発表した。

復旧支援AIエージェントのイメージ図

 KDDIでは、2021年から、さまざまなサービスを統合的に監視し、ワンタッチ操作や前提条件を満たす場合にはゼロタッチで復旧オペレーションを実行する「スマートオペレーション」に取り組んでおり、単体のシステムにおける障害は迅速にサービスを復旧できるようになったという。その一方で、複数のシステムが関連する複雑な障害の原因特定や、設備の状態を障害発生前の状態へと戻す対応には、依然として時間と稼働を要していたとのこと。

 そこで今回は、障害が発生したサービスとシステムの相関、設備アラームの発生状況、メンテナンス作業の実施状況などを統合的に分析して原因を特定する復旧支援AIエージェントを開発した。

 KDDIは、サービスやシステム構成に関する情報を構造化することで、運用向けデジタルツインを構築している。復旧支援AIエージェントは、複数システムに関わる障害をアラームで検知すると、運用向けデジタルツインに対し、中心性分析を用いて、障害が発生したサービスとシステムの相関を分析する。

 さらに、設備アラームの発生状況、メンテナンス作業の実施状況といった複数の情報と組み合わせることで、障害原因としての精度を高め、特定された原因を運用担当者に提示するとした。

 加えて、このAIエージェントと連携し、設備の切り離しといった具体的な復旧措置や、故障部位の交換対応時などに必要な保全作業を実行する「保全AIエージェント」についても、2026年度に導入する予定としている。