仮想化道場
x86への移行を果たすHP Integrity Superdome X
(2014/12/25 06:00)
x86サーバーで高可用性、高信頼性を実現するために
ミッションクリティカル分野のサーバーにおいて必要とされるのは、パフォーマンスだけでなく、非常に高い可用性と信頼性だろう。こういった機能がないと、24時間365日動作を止められないITシステムでは、安心して採用できない。
既存のx86サーバーの多くでは、ハードウェアやOSの可用性、信頼性も向上しているが、ハードウェアのトラブルをリカバリする機能が不足している。そのため、ハードウェアトラブルが起こると、OSがリブートしたり、ハードウェア自体がダウンしたりしてしまうことが多くなる。
そこでXeon E7 v2では、Intel Run Sureテクノロジーにより、CPUコアやメモリ、周辺IOなどのトラブルをチェックする機能を用意した。このIntel Run Sureテクノロジーは、前世代のXeon E7シリーズが搭載していたRAS(Reliability、Availability、Serviceability:信頼性、可用性、保守性)機能を強化したモノだ。
ただ、Xeon E7 v2は2014年2月にリリースされたが、実際にIntel Run Sureテクノロジーを利用して高可用性・高信頼性を実現したミッションクリティカルサーバーはほとんど出ていなかった。
これは、Intel Run Sureテクノロジーにはトラブルをチェックしてログを出力する機能はあるが、このログに従ってどのようなリカバリを行うのかは、OSやファームウェアの動作によるためだ。
そこでSuperdome Xでは、LinuxコミュニティとHPが協力して、LinuxのカーネルにIntel Run Sureテクノロジーを取り組む作業を行った。さらに、Red Hat Enterprise Linux(RHEL)、SUSE Enterprise LinuxなどでもSuperdome Xの機能を積極的にサポートしてもらうように働きかけている。これにより、RHELやSUSEの標準ディストリビューションでSuperdome Xがサポートされた。こうして、ようやく同技術を生かせる環境がそろってきた、ということになる。
また、OSだけでIntel Run Sureテクノロジーをサポートしている場合は、動作中のOSにトラブルが影響してしまうため、多くの場合、OSではデータを破棄して、リブートするしかなくなってしまう。
そこでSuperdome Xでは、各ブレードサーバーに専用のファームウェアを用意している。このファームウェアが、Xeon E7 v2が上げてくる情報をチェックしており、例えば、ネットワークカード(NIC)などを接続したPCI Expressインターフェイスにトラブルが起こったときには、OSにNICからのデータが上がる前に、ファームウェアがNICを初期化して、OSがリブートをすることを防いでいる。
もう1つ、Superdome Xのファームウェアでは、Superdome 2が持っていたハードウェアの物理パーティション(nPars)がサポートされている。ただし、Superdome 2のようにダイナミックに物理パーティションを変更することはできない。ファームフェアで物理パーティションを切って、OSを再起動する必要がある(スタティックな物理パーティション機能)。
なお、Linuxベンダーの標準ディストリビューションをSuperdome Xでサポートしているのは、オープンソースの標準的なOSを利用していこうというHPの姿勢の現れだろう。自社で独自にカスタマイズして、専用ハードウェアに搭載したLinuxは、すでにスタンダードのLinuxではない。このため、データベースなどさまざまなミドルウェアやアプリケーションの動作検証にコストも時間もかかってしまう。もし、カスタマイズLinuxでアプリケーションが動作しないとなると、修正を各OSベンダーやアプリケーションベンダーに依頼しなければならない。
そうなると、ソフトウェアベンダーにも負担が大きくなるし、すべてのアプリケーションをカスタマイズOSに対応させるわけにはいかないため、アプリケーションの数もおのずと限られてしまう。やはり、ハイエンドのミッションクリティカル製品といえども、ソフトウェアに関しては幅広い選択肢が必要になるのだろう。