仮想化道場

x86への移行を果たすHP Integrity Superdome X

x86サーバーで高可用性、高信頼性を実現するために

 ミッションクリティカル分野のサーバーにおいて必要とされるのは、パフォーマンスだけでなく、非常に高い可用性と信頼性だろう。こういった機能がないと、24時間365日動作を止められないITシステムでは、安心して採用できない。

 既存のx86サーバーの多くでは、ハードウェアやOSの可用性、信頼性も向上しているが、ハードウェアのトラブルをリカバリする機能が不足している。そのため、ハードウェアトラブルが起こると、OSがリブートしたり、ハードウェア自体がダウンしたりしてしまうことが多くなる。

 そこでXeon E7 v2では、Intel Run Sureテクノロジーにより、CPUコアやメモリ、周辺IOなどのトラブルをチェックする機能を用意した。このIntel Run Sureテクノロジーは、前世代のXeon E7シリーズが搭載していたRAS(Reliability、Availability、Serviceability:信頼性、可用性、保守性)機能を強化したモノだ。

Xeon E7 v2が持つIntel Run Sureテクノロジーは、メモリRASとシステムRASで構成されている
Xeon E7 v2が持つRAS機能。これらの機能を使えば、CPUコア、I/Oなどのエラーをチェックして、システムがダウンすることを回避できる
Xeon E7 v2のメモリRAS機能を使えば、DRAMのエラーをチェックして訂正したり、エラーを起こすDRAMをマップアウトしたりすることができる

 ただ、Xeon E7 v2は2014年2月にリリースされたが、実際にIntel Run Sureテクノロジーを利用して高可用性・高信頼性を実現したミッションクリティカルサーバーはほとんど出ていなかった。

 これは、Intel Run Sureテクノロジーにはトラブルをチェックしてログを出力する機能はあるが、このログに従ってどのようなリカバリを行うのかは、OSやファームウェアの動作によるためだ。

 そこでSuperdome Xでは、LinuxコミュニティとHPが協力して、LinuxのカーネルにIntel Run Sureテクノロジーを取り組む作業を行った。さらに、Red Hat Enterprise Linux(RHEL)、SUSE Enterprise LinuxなどでもSuperdome Xの機能を積極的にサポートしてもらうように働きかけている。これにより、RHELやSUSEの標準ディストリビューションでSuperdome Xがサポートされた。こうして、ようやく同技術を生かせる環境がそろってきた、ということになる。

 また、OSだけでIntel Run Sureテクノロジーをサポートしている場合は、動作中のOSにトラブルが影響してしまうため、多くの場合、OSではデータを破棄して、リブートするしかなくなってしまう。

 そこでSuperdome Xでは、各ブレードサーバーに専用のファームウェアを用意している。このファームウェアが、Xeon E7 v2が上げてくる情報をチェックしており、例えば、ネットワークカード(NIC)などを接続したPCI Expressインターフェイスにトラブルが起こったときには、OSにNICからのデータが上がる前に、ファームウェアがNICを初期化して、OSがリブートをすることを防いでいる。

Superdome Xでは、Xeon E7 v2が持つ高信頼性、高可用性を100%生かしきっている
ファームウェアがエラーのリカバリなどを行うことで、OSがリブートしないようにしている

 もう1つ、Superdome Xのファームウェアでは、Superdome 2が持っていたハードウェアの物理パーティション(nPars)がサポートされている。ただし、Superdome 2のようにダイナミックに物理パーティションを変更することはできない。ファームフェアで物理パーティションを切って、OSを再起動する必要がある(スタティックな物理パーティション機能)。

Superdome 2が持っていたnParsの機能をSuperdome Xで実現。ただし、ダイナミックなハードウェア変更はできない(スタティックなnPars機能)

 なお、Linuxベンダーの標準ディストリビューションをSuperdome Xでサポートしているのは、オープンソースの標準的なOSを利用していこうというHPの姿勢の現れだろう。自社で独自にカスタマイズして、専用ハードウェアに搭載したLinuxは、すでにスタンダードのLinuxではない。このため、データベースなどさまざまなミドルウェアやアプリケーションの動作検証にコストも時間もかかってしまう。もし、カスタマイズLinuxでアプリケーションが動作しないとなると、修正を各OSベンダーやアプリケーションベンダーに依頼しなければならない。

 そうなると、ソフトウェアベンダーにも負担が大きくなるし、すべてのアプリケーションをカスタマイズOSに対応させるわけにはいかないため、アプリケーションの数もおのずと限られてしまう。やはり、ハイエンドのミッションクリティカル製品といえども、ソフトウェアに関しては幅広い選択肢が必要になるのだろう。

Superdome Xでは、標準のLinuxを採用している。HP独自のカスタマイズではなく、カスタマイズ部分をLinuxコミュニティに移管して、標準ディストリビューションに組み込んでいる
HPがカスタマイズしたLinuxではなく、標準Linuxディストリビューションをミッションクリティカルで使えるようにしている

(山本 雅史)