日本HP、クラウド環境のIT性能を将来予測できる分析ツール群


執行役員 HPソフトウェア事業統括の中川いち朗氏

 日本HPは7日、統合IT運用管理ソリューション「HP Business Service Management 9(以下、HP BSM 9)」を拡充し、クラウド・仮想環境におけるIT性能の将来予測を可能にする分析ツール群「HP Service Intelligence」を発表した。IT環境の問題を発生前に予測して迅速に問題に対処し、ビジネスへの影響を回避できるという。

 昨今、クラウド・仮想環境の導入が進む一方で、その運用管理においては、動的に変化するITの構成情報と稼働状況の可視化や分析が難しいことが課題となっている。そのため、潜在的な問題の予測分析によるビジネスへの影響防止や、キャパシティプランニング、ビジネスサービス視点から的確に問題を把握できる分析ツールが求められているという。

 こうした課題に対応するのが「HP Service Intelligence」。リアルタイムに更新される構成情報から障害を予測分析する「HP Service Health Analyzer」、動的に変化するITリソースのキャパシティ管理を実現する「HP Service Health Optimizer」、全体のパフォーマンス情報を多角的にレポートする「HP Service Health Reporter」から構成される。

独自の即時異常検出エンジンを備える

 中核となるのは、HP BSM 9に実装された「ランタイム・サービスモデル」をベースとした予測分析ツールである「HP Service Health Analyzer」で、独自の即時異常検出エンジン「Real-time Anomaly Detection Engine(以下、RADEngine)」により、動的に変化するクラウド・仮想環境においても障害の事前予知を可能にする。

 例えば、従来の問題分析は、構成情報は静的、アラートのしきい値も固定で、しきい値の設定は職人の勘頼み。設定を間違えれば無駄なアラートに埋もれてしまう可能性もあった。

 これに対しRADEngineでは、統計理論を駆使し、挙動の周期性とトポロジーから異常値を抽出。障害の対応履歴も蓄積し、過去の経験から誤検知排除と根本原因解析の精度を向上する。

 具体的には、従来のように固定のしきい値ではなく、システム特性に応じた動的なしきい値を自動設定してくれる。システムのパフォーマンスがしきい値の許容範囲から逸脱した場合にアラートをあげるのだが、しきい値が状況に応じて動的に自動設定されるため、より高精度に障害検知が可能となる。これにより、IT構成が動的なクラウド・仮想環境においても、性能や障害の将来予測が可能になるというわけだ。

Sprint社の事例。紫の折れ線が実際のレスポンスタイムの遷移で、グレーの部分が自動設定されたしきい値。途中でサービスダウンが発生したデータを表示しているサービスダウンの30分前に折れ線がしきい値を超えている個所が。Sprint社では平均30分前にサービスダウンを予測できたという

 先行導入している米Sprint社では、体感としてパフォーマンス問題が発生する30分前に予測が可能になったとしている。障害を発生30分前に検知できると、高い信頼性が実現できる。「例えば、従来適用をあきらめていたサービスに対しても、クラウドインフラを適用できる可能性が生まれる」と執行役員 HPソフトウェア事業統括の中川いち朗氏は語る。

 また、最も直接的な効果として、より詳細なSLAを設定することも可能になるとする。「例えば、通年でのサービス可用性は99%以上、平均サービス復旧時間は15分以内、最長サービス復旧時間は30分以内、最長障害顧客通知時間は30分以内など、より厳格な目標設定が可能になる」(中川氏)としている。

30分前に障害発生を検知できると、従来適用をあきらめていたサービスにもクラウドインフラを適用できる可能性がSLAもより厳格な目標設定が可能となる

 50ノード(OSインスタンス)の場合の価格は、「HP Service Health Analyzer」が840万円から、「HP Service Health Optimizer」が504万円から、「HP Service Health Reporter」が840万円から。

関連情報