トピック

ビジネスのレジリエンス強化に不可欠!
クラウド時代に求められるデータドリブンの運用とは

企業におけるクラウド活用は当たり前のものとなり、基幹系システムをクラウド上で運用することも一般化している。その一方で、ハイブリッド/マルチクラウド化の拡大により、IT基盤は複雑化し、運用の難易度も大幅に増している。そうした課題を解決し、IT基盤の運用性の向上、そして業務、ビジネスのレジリエンスを高めるための手段が、データ駆動型運用だ。その実現に向けて、企業はどのような手立てを講じればよいのか。

クラウド時代の最適な運用に不可欠な「オブザーバビリティ」

Splunk Services Japan合同会社 ITOAスペシャリスト 松本浩彰氏

近年、オンプレミス環境とクラウドを併用したハイブリッドクラウドや、業務やビジネスの要件に応じて複数のパブリッククラウドを使い分けるマルチクラウドの活用が多く見られるようになった。結果、IT環境はより複雑さを増しており、その最適な運用に苦慮している企業は少なくない。プラットフォームの分散により、IT環境全体の状況を可視化したり、統合的に管理したりすることが困難になっているからだ。さらにはセキュリティリスクの増大といった課題も加わるなど、円滑な業務やビジネス活動を推進していくためにも、企業には改めてIT運用の在り方が再考することが求められている。

また、クラウドをはじめとするIT基盤上で、企業の生命線となる多くの業務やビジネスが展開される今日、システム障害やセキュリティインシデントを発生させるような事象を事前に予測、予防することで、事業活動を中断させない、レジリエンス(Resilience:回復性・弾力性)の実現が急務となっている。今後、IT基盤のクラウド移行がますます加速していく中、レジリエンスを確保するには、どのような運用を行っていけばよいのか。

Splunk Services Japan合同会社 ITOAスペシャリストの松本浩彰氏は、「まずはクラウドへの移行前に、運用も含めた自社のIT基盤のTo Be像を先回りして描かなければなりません。そうしたクラウド移行後の運用像を描き、具現化していくとともに、レジリエンスを高めるために不可欠な考え方、能力となるのが『オブザーバビリティ』(Observability:可観測性)です」と強調する(図1)。

図1 求められるモニタリングからオブザーバビリティへの進化

「オブザーバビリティとは、『何か起きた時に説明する能力』とも言えます。いわゆる『監視』は、"何を対象にモニターするのか"を明確に定義可能でした。対して、オブザーバビリティは、昨今の複雑化を増すIT基盤のように、『何を監視すればいいのか、はっきりと対象を定義できない』状況において、必須となる考え方です。IT基盤上で今、何が起きているのか、あらゆる情報を収集し、その状態を統合的に観測するのがオブザーバビリティの基本的なスタンスになります」(松本氏)

そうしたオブザーバビリティを実現するために必要不可欠となるのが、データだ。多種多様なシステムのデータを自動的かつリアルタイムに収集、分析し、処理可能な体制を構築していかなければ、今後、システムの安定運用は成り立たなくなってしまう恐れがある。

「運用を適切にデザインし、レジリエンスを高めていくには、データ駆動型の運用基盤の構築により、すべてのインフラやシステム、アプリケーションの状況をリアルタイムで把握し、問題の発生に迅速に対処できるようにしていかなければなりません」(松本氏)

ビジネスレジリエンス実現のための統合プラットフォーム「Splunk」

データ駆動型運用を推進していくためには、システムのリソースやサービスの状況を示す「メトリック」、システムで発生したイベントの履歴情報「ログ」、そして、複数のサービス間での処理のやり取りを可視化する「トレース」といったデータを収集する仕組みが必要となる。

これらをリアルタイムで収集・集約、可視化、分析することで、運用性の大幅な向上、そしてレジリエンスの強化を実現するソリューションが「Splunkプラットフォーム」だ(図2)。

図2 ログ・メトリクス・トレースの全量を収集しトラブルシューティングを自動化

Splunkプラットフォームは、構造化・非構造化を問わずすべてのデータをリアルタイムに収集、分析することで、重要なサービスの挙動をフルスタックで可視化するとともに、トラブルシューティングの自動化を可能とする。中でもクラウド移行を推進する企業にとって注目すべきソリューションが「Splunk Observability Cloud」だ(図3)。

図3 Splunk プラットフォームとSplunk Observability Cloud

Splunk Observability Cloudが提供する機能群とその優位性について見ていこう。APM(Application Performance Monitoring)は、アプリケーションのすべての動作を観測し、問題が発生した場合に「どういった処理が行われたのか」を一意に特定する機能を提供する。IM(Infrastructure Monitoring)は、パブリッククラウドサービスの種類や仮想化といったインフラ基盤を問わず、アプリケーションが動作したり障害ポイントになったりした瞬間に、インフラの状態を特定するための機能である。さらに、Real User Monitoring (RUM)により、ユーザー端末側でのアプリケーションの挙動を観測したり、Synthetic Monitoringにより、対象となるWebサービスの死活監視やパフォーマンス状況の把握等をしたりすることが可能だ。

「これらの機能群を組み合わせることで、顧客がクリックした瞬間からバックエンドのアプリケーションが稼働するまでの処理をすべて把握し、問題が発生した際にも、即座に特定、対処可能となります」(松本氏)

Splunk Observability Cloudの優位性は、これらの処理をリアルタイムで行えることにある。「膨大なトレース/メトリックデータをリアルタイムに蓄積、処理するために、Splunk Observability Cloudはプラットフォームにストリーミングアーキテクチャを採用しています。これにより、ニアリアルタイムに問題を検知、分析し、即座に障害点を特定可能としています」と、松本氏は説明する。

もう1つの優位性は、データ収集にオープンソースのオブザーバビリティフレームワークである「OpenTelemetry」を採用している点だ。

「OpenTelemetryの採用により、様々なデータを収集したり送信したりすることが可能となります。OpenTelemetryはオープンソースであることからベンダーロックインされることなく、企業自らが、様々な監視ツールやサービスからも運用管理に必要なデータを収集できるようになります。つまり、運用管理におけるイニシアチブをとれるようになるわけです」(松本氏)

セキュリティの強化についてもデータ駆動型による支援を提供

レジリエンスを確保するために不可欠なセキュリティ強化についても、Splunkはソリューションを提供している。その一つが、「Splunk Enterprise Security」だ。

Splunk Services Japan合同会社 技術統括本部 ソリューション技術本部の山内一洋氏は、「Splunk Enterprise Securityは、最先端のSIEM(Security Information and Event Management)機能を提供します。ありとあらゆる場所にデータとシステムリソースが分散している現状において、それらに対して同等のレベルでセキュリティやガバナンスを適用していくことが求められています。また、『特定のベンダーの製品でなければ、このデータを取得できない』といった状態では、今後、多大なセキュリティリスクを生じさせかねません。データを収集する段階では疑わしいかどうかはわからず、その兆候を示すデータがどこにあるかもわからないからです。対して、Splunk Enterprise Securityは、あらゆる基盤上に存在するデータを収集し、セキュリティ脅威に関する分析をニアリアルタイムに行うことが可能です」と説明する。

Splunk Services Japan合同会社 技術統括本部 ソリューション技術本部 山内一洋氏

セキュリティのオーケストレーションと自動化機能の提供により、セキュリティオペレーションセンター(SOC)の業務を支援するソリューションが「Splunk SOAR」だ。近年、標的型攻撃はさらに高度化しており、感染からわずか1、2時間程度で社内に拡散し、広範囲に被害を及ぼすケースもある。そうしたことから、セキュリティインシデントの発生を検知した際に、どれだけ早く対処できるかが課題となっている。

「Splunk SOARはニアリアルタイムに収集したデータを基にリスク判定を実施するとともに、感染した端末の遮断といった対処、そして、感染源の特定等の調査についても支援するソリューションです」(山内氏)

ハイブリッドクラウド上での安定運用から
Webサービスのパフォーマンス向上までSplunkが支援

Splunkプラットフォームを活用した先進企業の成功事例を紹介しよう。1つが、ハイブリッドクラウド基盤の安定運用に向けSplunkプラットフォームを導入した東京証券取引所の事例だ。東京証券取引所では、約30ある情報系システム基盤のハイブリッドクラウド化に伴い、障害ポイントが増加することを懸念。エンドツーエンドでプラットフォームやサービスの状況をリアルタイムに把握できなければ、ビジネスのレジリエンスを維持できないことを課題視していた。この課題を解決するため、Splunkプラットフォームを採用。定期的な自動モニタリングを実施することで、ボトルネックとなるポイントを特定、安定したサービスを提供可能な運用基盤を実現した。

もう一つが、ECサイトの品質向上に向けて、Splunkプラットフォームを採用したカインズの事例だ。同社では、ECサイトのリニューアルに伴い、顧客のデジタル体験を最適化するためのサービスの死活監視やWebサイトの表示速度を把握するため、Splunkプラットフォームを導入。ECサイトのパフォーマンススコアを10点台から80点台にまで劇的に改善した。

このように様々な目的を達成するため導入されているSplunkであるが、近年ではIT管理者だけでなく、経営層の活用も進んでいるという。「例えば、会社全体のシステムの稼働状況やセキュリティの状態、または顧客からのクレーム数など、様々な事項にKPIを設定し、それが維持されているか常に可視化しているケースもあります」と松本氏は話す(画面1)。

画面1 Splunkプラットフォームのマネジメント層向けダッシュボード画面の例。グループ全体のシステムの稼働状況やセキュリティの状態などを一元的に把握可能

繰り返しとなるが、今後、IT基盤はますます複雑化を増し、安定運用の難易度も上がっていくことは明らかだ。そうした課題を解決するためにも、データ駆動型による運用体制を構築していくことが急務であり、そのための様々な支援をSplunkは提供し続ける。

【資料無料ダウンロード】
クラウド活用の課題を克服! 従来の監視からオブザーバビリティへの転換が必須の理由
https://b-library.impress.co.jp/ud/product/code/WD-2023-0085

<お問合せ先>
Splunk Services Japan合同会社
URL:https://www.splunk.com/ja_jp
Email:splunkjp@splunk.com