ニュース

New Relic、「New Relic One」でAI支援によるインシデント対応機能を強化

三柳英樹

2021年4月9日 12:00

　New Relic株式会社は7日、エンジニア向けのパフォーマンス分析プラットフォーム「New Relic One」について、自動で異常を検出できる機能「Anomaly Detection」を追加した。無料アカウントユーザーも含め、すべてのユーザーが追加費用不要で利用可能。また、従来提供してきた「New Relic Applied Intelligence」に、インシデント対応能力を強化する新たな機能を追加すると発表した。

　New Relic Oneは、顧客がより完璧なソフトウェアを作成するために構築された、クラウドベースのオブザーバビリティ（可観測性）プラットフォーム。

　New Relicでは、AIOpsはAIと機械学習を潜在的な問題の予測と根本原因の特定、解決の自動化に活用できると期待されてきたが、一方で、時間のかかる実装とトレーニングや法外な価格設定などが障壁となり、多くのDevOpsおよびSREチームはいまだにAIOpsの実現に苦戦し、その価値を実感できていない状況が続いていると説明。今回発表した次世代のAIOps機能は、こうした問題を解決し、オブザーバビリティの力をすべてのエンジニアの手に届け、AIOpsの価値をすべての人々にもたらすとしている。

　New Relic Applied Intelligenceでは、システムの異常挙動を自動で検出する「Proactive Detection」と、アラートを自動的に関連付けてアラートノイズを削減する「Incident Intelligence」の2つが提供されており、このうちProactive Detectionが無料アカウントを含めたすべてのユーザーに提供される。

　Proactive Detectionは、すべてのアプリケーション、サービス、ログデータにおけるスループットやエラー、レイテンシーなどのゴールデンシグナルに基づき、自動的に異常を検出する機能。エンジニアは、Slackやそのほかのコミュニケーションツールで、Proactive Detectionからの通知を受け取れるため、詳細分析のデータをもとに迅速なトラブルシューティングが可能となり、潜在的な問題をユーザーに影響が及ぶ前に防ぐことができる。

　New Relic Applied Intelligenceに追加される新たな機能のうち、アラートノイズの削減のための相関分析では、イベントがシステム全体における時間、アラートメッセージのコンテキスト、さらに関連データに基づいて自動で相関付けられるため、エンジニアは対応に必要なすべてのデータを1つのインシデントデータとして確認できる。事前トレーニング済みの機械学習モデルを使用することで、ゼロからAIを学習させることを省き、インシデント対応のさらなる高速化を実現する。

　根本原因分析は、インシデント発生時、推定される根本原因について憶測を排除し、問題をより迅速に解決できるようになる。エンジニアは未解決の各問題の発生理由や、影響を受けているサービスとシステム、解決に向けた必要な対策をすばやく把握できる。また、それぞれの問題を解決するのに最適な対応者は誰かについて、機械学習に基づいた提案も行われる。

　また、ログデータのパターンと外れ値を検出するために、ログデータをNew Relic Applied Intelligenceの分析対象に追加。エンジニアは何百万ものログメッセージをワンクリックで検索、ログデータを自動的にクラスタ化してマニュアルのクエリを減らすことで、膨大なデータから異常パターンを迅速に発見できる。ログパターンはNew Relicのテレメトリーデータプラットフォームにイベントとして蓄積される。これによりエンジニアは、ログデータのトレンドのより迅速な分析とトラブルシューティングを行うために、ログパターンに基づいたダッシュボード、アラート、クエリの作成が容易になります。

　Service Nowや、そのほかの主要なインシデント管理ツールとのインテグレーションも強化。新たなインテグレーション機能により、ツールをまたいでインシデントを管理する手間を省略する。New Relic内の相関する問題のステータスが、Service NowやPager Dutyなどのインシデント管理ツールと双方向に同期され、より効率的かつ効果的にインシデントを解決できるようになる。