名古屋大学、キャンパスネットワークの管理基盤にデルのサーバーとiSCSIストレージを導入
名古屋大学では、構成員2万6000名を支えるキャンパスネットワーク「NICE」を2010年3月に刷新。その運用管理システムに仮想インフラ基盤を採用した。また同時に、情報科学研究科では、仮想サーバーを用いた「教育・研究用先端計算機システム」(以下、計算機システム)を導入し、仮想インフラ基盤の効果的な活用法を探っている。
今回は、これらのプロジェクトに携わった名古屋大学大学院工学研究科 計算理工学専攻 基盤計算科学講座 先端情報環境グループの河口信夫教授に、同大の仮想化インフラ基盤への取り組みと、大学における仮想化・クラウドの活用に関して、考え方を伺った。
■キャンパスネットワークの管理基盤と計算機システムに仮想環境を導入
名古屋大学が導入した仮想環境 |
「NICE 4」は、2010年3月まで運用されてきた「NICE 3」に変わって導入されたネットワークで、コア部分には10Gigabit Ethernet(GbE)を採用したほか、700台規模のレイヤ2スイッチを導入している、大規模なネットワークだ。
NICEでは、大規模ネットワークにおける運用管理の複雑化に対応するため、セキュリティインシデントやIPアドレスの管理データベース、ACL管理システム、VLAN管理システムなどを導入しており、NICE 4からは、これを仮想インフラ基盤の上で稼働することにした。移行以前のNICE 3まで、ネットワーク管理ツール群は個別のPC上で稼働していたが、これを一気に移行させてしまったのだ。一方の計算機システムは、研究用リソースを提供するシステムのプロトタイプとして導入された。
これらの基盤としては、デルのx86サーバー「PowerEdge R905」と、iSCSIクラスタストレージ「EqualLogic PS6000」が導入されている。クアッドコアOpteronを4基搭載するPowerEdge R905は、1台で計16の物理コアを持ち、メモリも64GBと大容量を搭載しているため、多くの仮想マシンをその内部で稼働させることができる、パワフルなサーバーだ。これを、NICE 4の管理システムでは2台、計算機システムでは4台、それぞれ利用している。
一方のEqualLogic PS6000は、iSCSI SANによるクラスタを構成するストレージで、NICE 4の管理システムでは2台、計算機システムでは4台、それぞれ採用した。とにかく高い性能がほしい、信頼性がほしい、といった場合はFC SANが優れているということに異論はないだろうが、コスト面で高くつく。そこで名古屋大学では、システムの身の丈を考え、イーサネットベースで安くすむiSCSIを選択したのだ。
それでも当初は、iSCSIに対する不安があったというが、「ローカル環境で利用する分には、ネットワークの帯域を使い切るだけの性能がある」ことも確認できたため、最終的にはiSCSIの導入を決断している。
■拡張性のあるiSCSIストレージは、当時EqualLogicだけだった?
名古屋大学大学院工学研究科 計算理工学専攻 基盤計算科学講座 先端情報環境グループの河口信夫教授 |
では、なぜ名古屋大学はデルの機器を選択したのか。実は、大学へ納入する機器は入札で決まるため、このシステムでは明確な意図を持ってデルの製品を選んだわけではないのだという。ただし、「ストレージ側でiSCSIを選択し、必要な要件を決めていった中で、(入札があった2~3年前)当時の製品としては、ほぼ決まってしまっていたのかもしれない。サーバーも、親和性を考えると同一メーカーのものが安かったのかも」と河口教授は話す。
そのストレージの要件で特に重要視されたのは、コストと拡張性の2つだ。せっかく安価にできるiSCSIを選択したのに、価格が高くては意味がなくなってしまう。また、「将来は大規模構成になると考えると、クラスタ構成をサポートするのは当たり前」であり、設定も簡単でないと運用上苦労する。こうした条件を加味すると、入札当時の製品では、EqualLogicにほぼ限られてしまっていたのではないか、という。
「河口先生が重視されているようなオープン性を持つ製品なら、ユーザーは競争から生まれるコストメリットを得られる。EqualLogicは特徴的な機能を持つが、デルのサーバーにしかつながらないのではない。オープン性を維持した設計の製品であり、そこを求められるお客さまには、高い効果を提供できたのではないか」(デル)。
一方、VMwareを導入した理由については、河口教授は「仮想化の標準を見極めるため」と「VMware Lab Managerによる管理機能を使いたかったため」という、2つの理由を挙げた。前者については、「規模を見ても分かるとおり、今回はトライアル的な意味合いが強い。その時に一番いいものを入れて、これが標準だと分かった上で、機能の取捨をしたかった」としたほか、後者については、「仮想環境において、どのユーザーがどれだけのリソースを使っているか、という管理までできないとダメで、Lab Managerで、これができるのではないかと思った。また、2万6000名いる本学では、どう使っていくかを考えるとLDAP対応が必須で、その面でも機能を試したかった」と説明している。
なお管理という点では、ストレージの管理をどこから行うかも検討課題だったという。EqualLogicにもVMwareにも、スナップショットやバックアップの機能があるが、仮想マシンの状況がわからないストレージ側が勝手に管理してしまっては、仮想環境がおかしくなってしまう可能性がある。そこで名古屋大学では、ほとんどのストレージ管理をVMware側から行っている。
ただ例外として、EqualLogicの持つシンプロビジョニング機能は有効に利用されている。河口教授は「ボリュームの容量は、必ず余裕を持って使いたいので、本来以上の容量を使えるシンプロビジョニングは魅力的だ」と、その効果についてコメントしていた。
■苦労をしてでも、P2Vを機会に環境を整備しておくべき
そもそも今回、NICE 4の管理システムを仮想インフラ基盤に移行させたのは、管理コストと、代替機のコストが問題になったためという。さまざまなハードウェアを管理するよりも、仮想インフラ基盤に統合したほうが管理コストが安く済むほか、仮想化しておけばサーバーの乗り換えも容易であることから、最終的には仮想環境への移行が決断された。仮想マシンは、10個程度が定常的に動いているほか、開発などでさらに10個程度が追加されているときもあり、20~30が動いたり止まったりしているという。
従来、こうした環境物理サーバー上に1つ1つ構築されていたわけだが、古い物理サーバーから仮想環境への移行(P2V)については、多くの苦労があったそうだ。「P2V自体は昔と比べるとやりやすくなったので、そのまま移行する場合は簡単。しかし多くの場合は、OS(このシステムではCent OSを採用している)やミドルウェアのバージョンを上げたい、といった要望がある。例えば、MySQL、PHP、Apacheなどのバージョン違いで動かなくなる、といったことが必ず起こる」のだ。
では、同じバージョンをそのまま使い続ければいいのか、といえば、それもセキュリティなどの面で問題がある。河口教授はこうした問題について、「引っ越しの時にゴミを整理するのと同じように、仮想化の機会にきちんとやらないといけない。仮想化すると、あとはVMotionで他の環境に動かすだけなので、次の機会が取りにくい」と述べ、仮想化をいいきっかけにして、環境の整備は進めておくべき、とした。
「入れる時に努力するか、後から苦労するかの違い。導入時は担当者の意識も高いが、後になれば下がってしまうし、入れた人がいなくなってしまうこともあるので、本当は入れた時に苦労しないといけない。本来は、将来のコストまでを考えた作り方をするべきであり、その1つの機会が、仮想化導入の時だろう」(河口教授)。
さらに河口教授は、こうした導入時に苦労すべきことの1つとして、名古屋大学でもまだ実現できていない課題としながらも、「仮想マシンのインベントリ情報の管理をきちんと整備する必要がある」と指摘した。
ここでいうインベントリ情報とは、「この仮想マシンにはこのOSが入っていて、ここまでパッチがあたっている」「導入されているこのソフトとこのソフトには依存関係がある」といったことを指す。物理サーバー環境であれば、1台1台環境が分かれているので何となくわかることでも、多数のサーバー環境が統合されている仮想サーバー環境では、そうはいかない。それだけに、管理台帳的なものでしっかりと管理されている方が、効率がいいわけだ。
これをさらに一歩すすめると、「Webサーバーのようなシステムであれば、本当はIaaS的に個々のOSを動かすのではなく、SaaS的に、サービスだけを提供した方が運用管理が楽」ということにもなる。河口教授は、「(IaaSでも)名古屋大学標準のOSを決めて、それ以外は個々に頑張ってもらってもいいけど、標準に乗ってくれれば管理部門がサポートしますと、と本来はやるべきだろう。そうした方向性は絶対にある」と述べ、こうした標準化の必要性を強調していた。
一方の計算機システムは、仮想環境によって容易なシステムの配備が可能になるメリットを享受できる。こちらは研究目的のため、場合によっては100個程度の仮想マシンが動作するときもあるとのことで、その配備には、環境を容易に追加できるLab Managerが利用されている。
現在は、テストとして数研究室での利用にとどまっているこのシステムの利用を、ゆくゆくは拡大していきたいとはするものの、そのためには、仮想環境の作成に関するポリシーをどう運用していくが課題になっているのだという。Lab Managerによって、仮想マシンが容易に追加できてしまうために、必要以上に仮想マシンが乱立すると、リソース、特にメモリが食いつぶされてしまう。「Lab Managerを利用すれば、期間を限って仮想マシンを追加するようなこともできるが、この機能を使うのかどうかを含めて、運用のポリシーを決めていきたい」とした。
■学内クラウドで“見えないコスト”を解消できないか?
今回の取材では、また、大学でのクラウド活用に関する将来の可能性についても、河口教授に伺ってみた。企業ではクラウドの活用が真剣に検討されるようになったのを受け、大学でもクラウドの活用は議論されているという。
ただし、大学、特に大きな公立大学は敷地の面で恵まれているので、外部のデータセンターにホスティングする、というデマンドがあまりない。また、「予算の弾力性の問題で、これだけ使ったらいくら、というオンデマンドの課金方法は嫌がられる」ので、パブリッククラウドは活用しにくいのだそうだ。「だから、つい買ってしまって、無駄に遊ばせておくことが多かった」と河口教授は問題点を指摘し、システムの再利用が可能になるプライベートクラウド(学内クラウド)の方が、大学には適しているとする。
例えば、昼間は学生が研究で使っているシステムを、夜は計算用など別の目的に使うことができれば、使用者を限らないライセンスの場合は、費用を節約することができる。企業でも、昼間は通常業務に、夜はバッチ処理に利用する、といったように、時間で用途を変える利用法はあり、それと同じことが大学でも可能というわけ。
「同時に使う人が限られているのに、こんなに多くのライセンスが必要なのかを、真剣に考えるべき。米国では、ライセンスをクラウド上で共用する動きが起こっているそうで、日本でも、これができればいいのではないか」と、河口教授は話す。
また散在するシステムを大きな学内クラウドにまとめることで、“見えないコストの解消”も図れるとする。大学では、「ITの管理を学生に任せていたり、得意な先生がちょっとやっていたり、といった形はいっぱいある。サービス残業のような形で隠れている」(河口教授)そうで、「年に一度の(点検時の計画)停電の時に、そうしたボランティアの管理者が一度に出てきて作業をしているが、これはすごいコスト」なのだという。
デルによれば、これは米国でも問題になっており、「本来は研究目的のツールなのに、ツールを管理するところにコストが発生する。これをどう解消するか、というところで、見えないコストの問題に取り組むようになっている」とのこと。ただし、こうしたコストは“見えない”がゆえに、気付いてもらうのがとても難しい。“見えないコスト”は現場にいないとわかりづらいので、ハードルはまだまだ高い」のだという。
学内クラウド導入にかかわる別の課題としては、予算の配分の問題もある。大学は通常、各研究室や先生が事業主として予算を持っているので、きちんとした学内クラウドシステムを構築するためには、その予算を吸い上げないといけない。しかし、各研究室が安価なサーバーを買って運用するのと、全体でクラウドを構築し研究室に課金するのとを比べると、“安価なバラバラのサーバー”の方が安く見えてしまうので、大きなシステムの必要性を感じてもらいにくくなっている。
河口教授はこの点について、「でも、個々のシステムを運用するには、その裏で人のコストがずっとかかっているはず」と指摘。各研究室の予算をまとめ、サーバー統合などによって、ITをきちんと管理された形することで、こうした“見えないコスト”を解消するべきだとした。
運用管理作業ではなく、本来の研究に関する作業をしないといけないはずなのに、管理に手間を取られてしまって能率が落ちている、といったシーンは、よくあること。統合による集中管理と自動化によって、そうした人を解放すれば、大きなメリットを提供できる。こうしたメリットが、学内クラウドによってもたらされるかもしれないのだ。
ただし統合する際に、リッチなシステムにしすぎては、コスト面での割があわなくなってしまうため、運用コストを安くできる最適な構成を見極める必要があるのは、言うまでもない。さらに「先ほど述べたように、大学ではオンデマンドの課金方法は嫌がられる。1回10万円入れてくれればずっと使っていいですよ、というシステムが大学には向いている」のだそうで、この面でも、各研究室が納得できるような課金体系を考えなければいけないとした。