トピック

ITインフラの“完全自動運転”を見据えた第1弾
CloudIQがDell EMC PowerEdgeサーバーをサポート

長らくクルマは「人がハンドルを握って自ら運転するもの」という存在だった。ところが昨今は、位置特定や映像認識、距離測定、AI予測をはじめとする多種多様なテクノロジーの著しい進化によって「自動運転」がリアリティを帯びてきたことは周知の通りである。

“操る悦び”は横に置いておくとして、クルマを移動手段と捉えるならば運転の自動化はまさに革命的だ。歩行者や他のクルマの動きに細心の注意を払う、信号や標識をくまなくチェックする、今どこを走っているかを常にアップデートする、計器を見ながら車両に異常がないかをチェックする、交通ルールや周囲の状況に照らして最善の操作をする…一瞬たりとも気を抜けない「運転制御」から人を解放し、目的地に到着するまでの時間を別のことに自由に使わせてくれることの価値ははかりしれない──。

人手で行われている管理タスクを自動化する
自律型コンピュートインフラへのアプローチ

企業が熾烈な市場競争の中を突き進んでいく上で、各種のシステムやアプリケーション、つまりは“デジタル”の力が不可欠であることに異論を挟む余地はない。障害を起こすことは商機ロスに直結し、企業の信用をも失墜させることになる。だからこそ情報システム部門などの専任組織はITインフラを粛々と稼働させるべく常に目を光らせている。監視ツールから深刻なアラートが上がろうものなら、関係者が躍起になって原因を特定し、障害復旧に奔走。時に“職人技”とも評される運用スキルは現場でこそ称賛されることがあるが、そもそも論に立ち返って企業活動を俯瞰し、それがあるべき姿か否かをじっくり考える必要もあるだろう。

企業のデジタル武装は勢いづくばかりでシステムの数はどんどん増大している。その一方で、運用管理を担うIT部門は慢性的な人手不足。日々の障害対応やメンテナンスなど眼前のタスクをこなすのが精一杯であり、今もっともニーズが高いDX(デジタル変革)具現化のための提案やアクションにまで手が回らないとの声がそこかしこから聞こえてくる。この構図を塗り替えるには、ITインフラの運用管理のあり方を抜本から見直すことが優先課題の筆頭に挙がる。いかにして手をかけないか、つまりは「ITインフラの自動運転」が希望の星であり、そこに紐づく技術動向に日頃から敏感でなければならない。

運用業務の自動化については、既に様々な角度からアプローチが始まっている。興味深いものとして、デル・テクノロジーズの委託によりフォレスターが2021年3月、サーバー担当のITマネージャー613人以上を対象に実施した調査を紹介しよう。「サーバーインフラストラクチャー管理タスクは、IT管理チーム内でそれぞれどの程度自動化されていますか?」という設問に対して、「OSへのパッチ適用」「ファームウェアおよびドライバーのアップデート」「サーバーの監視」「セキュリティー監査/スキャン」といった項目については、50%以上のITマネージャーが「完全に自動化」または「手動より自動化のほうが多い」と答えている。

こうしたトレンドを受けて、デル・テクノロジーがより包括的な観点で目指すべき方向性を示したのが「自律型コンピュートインフラ」というコンセプトだ。「現在人手で行われている管理タスクを極力自動化し、人はDXにつながるイノベーションに注力できるようにしたいと考えています。クルマに例えれば“レベル5”の完全自動運転に相当する、人間の管理者を一切必要としないサーバー管理を目指します」──。こう語るのは同社の岡野家和氏(データセンター ソリューションズ事業統括 製品本部 シニアプロダクトマネージャー)だ。

岡野家和氏(データセンター ソリューションズ事業統括 製品本部 シニアプロダクトマネージャー)

ストレージ製品の管理を担ってきた
Cloud IQがDell EMC PowerEdgeサーバーにも対応

では、それをどうやって実現するのか。中軸となるのが、既にストレージ製品で提供している「CloudIQ」の仕組みである。

CloudIQは機械学習を活用した予測分析により、Dell EMC PowerMaxやPowerStore、PowerScale、PowerProtect DDをはじめとするデル・テクノロジーのストレージ製品の全体的な正常性をプロアクティブに監視および測定する、無償のクラウドネイティブアプリケーション(SaaSポータル)である。岡野氏によれば、CloudIQには現在6万を超えるシステムが接続されており、1日あたり400億以上のデータポイントからテレメトリを収集し、2500万回以上のヘルススキャンを実行しているという。

そして、さらに大きなトピックがある。2021年8月、デル・テクノロジーズはCloudIQ上でのDell EMC PowerEdgeサーバーのサポートを開始したのだ。これにより、Dell EMC PowerEdgeサーバーに標準搭載された「iDRAC(integrated Dell Remote Access Controller): アイドラック」から取得した詳細なハードウェア情報をCloudIQに集約し、監視することが可能となったのである。

「デル・テクノロジーズの外付けストレージ は2021年第2四半期(4~6月)に国内売上No.1(※1)を達成。同様にx86サーバーについても2021年第2四半期(4~6月)に国内売上額および出荷台数シェアNo.1(※2)を達成しています。国内市場トップに立つストレージとサーバーをCloudIQで監視できるようになったことで、ITインフラの運用自動化に向けて大きなアドバンテージを確立できたと自負しています」(岡野氏)。

なおデル・テクノロジーズでは、ネットワーク製品のDell EMC PowerSwitchについても10月にCloudIQのサポート対象に加え、既にストレージ、サーバー、ネットワークを一元化したITインフラの監視、解析、アラート管理を実現済みだ。

※1) 出典: IDC Worldwide Quarterly Enterprise Storage Systems Tracker 2021Q2, Share by Company, Product Category Group: External OEM
※2)出典:IDC Worldwide Quarterly Server Tracker, 2021Q2. Share by Company.Product Category=x86

サーバーのヘルススコアや詳細情報をはじめ
パフォーマンスに関する情報も一元監視

今回リリースされたCloudIQ for PowerEdgeは、監視対象にしたいサーバーのOpenManage EnterpriseにCloudIQプラグインをインストールすることで利用可能となる。

第1弾として提供されているのが、次の4つの機能だ。

オーバービューダッシュボード: システムヘルス、アラート、保証ステータスの統合ビューを単一のポータルで提供する。
監視 & HWインベントリ: Dell PowerEdgeサーバー1台ごとにハードウェア、ファームウェア、ライセンス、ワランティ情報を追跡。場所を問わないシステム監視を実現する。
コンポーネントヘルス: ハードウェアの問題が環境に影響を及ぼしてしまう前に早期に認識・解決を図り、リスクを低減する。
パフォーマンス: CPUやメモリーなど重要なコンピュートリソースを監視することでシステム停止を予測・回避し、早期プランニングをサポートする。

実際にCloudIQによって、どんな監視が可能となるのだろうか。相場宏二氏(カスタマーソリューションセンター センター長)は、「CloudIQの最も有益なところは、ITインフラを構成するサーバー、ストレージ、ネットワークなど機器を横断的に監視し、障害に繋がる緊急性の高いオペレーションが必要なデバイスから順に表示するとともに、その対処方法を教えてくれる点にあります」と語る。

相場宏二氏(カスタマーソリューションセンター センター長)

CloudIQのコンソール上には監視対象として登録したサーバーの一覧が表示され、そのうちの1台を選択すると、ヘルススコア情報のほかCloudIQで収集されているCPUやメモリー、ストレージのコントローラーなどの詳細なインベントリ情報をすべてクリック操作のみで確認することができる。

パフォーマンスに関する情報も同様だ。「CPUやメモリーの利用率、I/O負荷、CPUの温度変化などの詳細情報が時系列で表示されます」(相場氏)。さらにVMware vSphereなどで仮想化されたサーバーの場合、そこで稼働している仮想マシンにドリルダウンし、それぞれのIPアドレスやゲストOSの種類やバージョン、vCenterのバージョン、クラスタの名前などの詳細情報を確認することが可能だ。

もちろん仮想マシンについてもパフォーマンス情報を時系列で確認することができ、例えば急激なメモリー負荷の上昇などの異常がどのタイミングで起こったのか、グラフ上に可視化されるとともに、その仮想マシン本体のファイルがどのストレージ上に保存されており、どのネットワークスイッチを介して通信しているのかといったトポロジーもEnd to Endのマップでたどることができる。「このようにCloudIQはVMware vSphereとも非常にスムーズに連携し、仮想基盤の安定稼働を支えます」と相場氏は強調する。

そして重要なことは、今回リリースされたCloudIQ for PowerEdgeは段階的なリリースのあくまでも“第1弾”であることだ。「ITリソース利用開始までの時間を短縮する高速プロビジョニング、サーバーが自ら修正を行う異常検知と自動リカバリー、サーバーが自ら稼働環境を最適化するプロアクティブなワークロードチューニング、サーバーが自らメンテナンスを行うポリシーベースのアクション実行など、自律型の運用管理に向けた要素技術はすでにめどが立っています」と岡野氏。10月には、ユーザー企業がCloudIQの発信情報をServiceNowやSlack、Microsoft Teamsといったツールに統合できるようREST APIのサポート計画も公表している。今後、レベル5の完全自動運転を見据えた第2弾、第3弾のリリースが控えており、その動向から目が離せない。