ニュース

富士通研究所、パブリッククラウドのメンテナンスによる顧客への影響を低減する運用技術を開発

 株式会社富士通研究所は28日、メンテナンスが原因で顧客の業務を遅延・停止させることなく、安心して使えるクラウドを実現するためのクラウド運用技術を開発したと発表した。

 パブリッククラウドでは、メンテナンスのために仮想マシン(VM)を一旦停止させて別のサーバーで再起動することが必要で、そのために利用者も業務を一時的に停止せざるをえないという課題がある。

 また、VMを停止させずに別のサーバーに移動するライブマイグレーションにより業務の停止を回避することもできるが、VMが高負荷のときには一時的な性能低下や数秒間の停止などの業務への影響が発生することがある。このため、VMが低負荷の時にライブマイグレーションを行う必要があるが、多数のユーザーが利用するパブリッククラウドでは、VM間で都合のよいタイミングを調整することが困難となる。

 今回、富士通研究所では、業務負荷予測と高速な組み合わせ最適化により、クラウド内のすべてのサーバーについて、顧客業務への影響が少ない時間帯でメンテナンスを行う計画を短時間に作成する技術を開発した。

 あらかじめ、顧客の業務が実行されるVMごとに、過去のメンテナンス時にライブマイグレーションにかかった時間とその時のVMの負荷の関係を、機械学習によりライブマイグレーション所要時間の予測モデルを作成。この予測モデルに基づき、メモリ使用量や通信量など外部から観測可能なデータによって推定したVMの負荷から、VMごとにライブマイグレーション所要時間を算出することで、メンテナンスを行った場合のライブマイグレーションによる業務への影響を少なく抑えられる時間帯を分単位で予測する。

 また、業務への影響の少なさとVMごとのメンテナンス完了期限を両立し、かつ、なるべく短期間でクラウド全体のメンテナンスが完了する計画を、大量の組み合わせの中から効率的に算出する技術を開発。サーバーとVMの構成情報や、メンテナンス可能な条件などのクラウド運用特有の制約を用いることで、短時間で最適な解を算出する。

 富士通研究所では、商用クラウドの約5000VM分の稼働データで、各VMは全体の8割の時間でCPU負荷が90%以上、残り2割の時間は負荷が低いという条件でのシミュレーションの結果、従来技術ではのべ425VMで業務の負荷が高い時にメンテナンスが実行されたのに対して、開発した技術ではすべてのVMについて業務の負荷が高い時期を避けてメンテナンスが実行されることを確認した。

 今回開発した技術を活用することで、クラウドのメンテナンスによる顧客業務への影響を少なくすることができるため、これまでクラウド利用が難しかった、より安定稼働が必要な業務を行う顧客のクラウド利用を支援すると説明。今後、富士通株式会社が提供するクラウドサービス「FUJITSU Cloud Service K5」の運用を支える機能として、2018年度中のサービス化を目指す。