トピック

大量データを処理するゲノム解析基盤をAzureで整備 採用の決め手はクラウド経験不足をカバーするサポート力 ストレージ・計算リソース管理の手間も抜本削減

臨床検査受託と臨床検査薬開発の双方を傘下に持ち、グローバルでも稀有な存在であるH.U.グループホールディングス(以下、「H.U.グループ」)。その中にあって、グループ全体の研究開発を加速させる役割を担っているのが、H.U.グループ中央研究所です。2021年、研究開発のさらなる加速に向け、複数に分かれていたオフィスを新拠点に集約するプロジェクトが開始されましたが、ここで研究開発に不可欠なシステムをオンプレミスで整備してきたがゆえの“場所の縛り”による業務停止リスクが顕在化します。この問題の解消に向け、 H.U.グループ中央研究所は、Microsoft Azureによるゲノム解析基盤の整備を決断。マイクロソフトのFastTrack for AzureやCloud Solution Architect(以下、CSA)チームによる手厚いサポートの下、2022年1月から稼働を開始することで、場所を問わない作業とともに、ストレージ・計算リソース管理の手間も抜本的に削減されました。今後はマイクロソフトの支援を受けつつ、クラウド基盤を他社との協業の場としても進化させる計画です。

オフィス移転で明らかになったオンプレミスの“課題”

 H.U.グループは国内外約50社の事業会社から成るヘルスケアグループです。臨床検査受託大手のSRLと臨床検査薬大手の富士レビオの経営統合により、2005年にみらかホールディングス(現:「H.U.グループホールディングス」)が持株会社として発足。以来、H.U.グループが傘下に持つヘルスケア領域(滅菌関連事業、在宅・福祉用具事業)も含め、統合のシナジー効果を発揮することで、現在の社名の由来である「Healthcare for You」の実現に向け邁進しています。

 その中にあって、これまで事業会社ごとに行われてきたバイオ関連技術やAIによる画像診断技術、各種の検査技術などの広範な基礎研究を一括して担っているのが、2017年に誕生したH.U.グループ中央研究所です。他業界と同様、医薬・ヘルスケア業界でも研究から事業化までのリードタイムは年々、短期化しています。H.U.グループ中央研究所はそこでの事業会社連携の中核として、グループの研究開発を加速させる役割を担っています。

 その推進に向け、もはや不可欠な存在となっているのが大量データ処理を担うITシステムです。H.U.グループ中央研究所 事業連携推進部バイオインフォマティクス課 課長の湯原悟志氏は、「医薬・ヘルスケア領域では技術革新を背景に、例えばヒトゲノム解析では1件当たりのデータ量が数百GBになるほど急増しており、もはや大規模なシステム抜きでの業務遂行は考えられなくなっています。私たちにとって研究・検査のための各種システムは基幹システムにも位置づけられます」と説明します。

 H.U.グループでは基礎研究と事業化の双方を狙いに、H.U.グループ中央研究所と事業会社で多様なシステムがオンプレミスで整備されてきました。ただし、H.U.グループ中央研究所がさらなる研究の加速に向け、2022年1月の東京・あきる野市へのオフィス移転を決定したことで、オンプレミスゆえの課題が浮上します。それが、システムの利用場所の“縛り”により、このままではいくつかの業務の停止が免れなかったことです。

 実はH.U.グループ中央研究所の業務の中には、事業会社と共同で複数拠点にまたがり行っているものも少なくありません。相模原と八王子という拠点をまたいで行われていたゲノム解析もその1つです。オフィス移転はそれらの検査施設や研究所の集約も狙いとしています。

 問題は、両拠点とも最終的に新オフィスへ移転することは共通するものの、各種の設備移転の手間から、その時期が約半年もずれてしまうことにありました。すでに述べた1件当たりのデータ量の膨大さからネットワーク経由のデータ転送も一筋縄ではいきません。「結果、データのやり取りで相模原拠点の孤立化が免れず、このままではゲノム解析業務の継続が困難になりかねない状況に直面したのです」と湯原氏は振り返ります。

初めてのクラウド利用の不安を払拭する“知恵袋”

 H.U.グループ中央研究所は2020年に入り、湯原氏を中心とする3名のメンバーで対応策の検討に着手します。そこで真っ先に候補に上り、各種議論を経て最終的に採用されたアイデアが、事業会社の一部システムで試験的に利用が進められてきたパブリッククラウドの活用です。具体的には、オンプレミスシステムのクラウド移行を柱とする、データ管理/共有も可能なゲノム解析基盤の整備です。この手法であれば、拠点間での大量データのやり取りがそもそも不要となり、場所を問わないシステム利用も可能になることで業務停止を回避できます。

 このアイデアにおいて湯原氏は、クラウドによる運用の手間の抜本削減という副次的なメリットも高く評価したといいます。H.U.グループ中央研究所ではこれまで、先端技術研究の一環として各種システムを自社で整備し、運用も現場のスタッフが主体となり行ってきました。しかし、データ量の急増に伴いストレージ・計算リソース管理の負担も増し、本来業務に充てるべき時間が少なからず削がれる事態を招いたそうです。研究の加速に向け、この問題は決して看過できるものではありませんでした。

 H.U.グループ中央研究所は2020年末になり、クラウドによるゲノム解析基盤の整備を正式決定。2021年初頭からクラウドの選定に取り掛かります。その過程では事業会社が利用していたものも含めて複数のクラウドが俎上に上り、ベンダーから話を聞きつつ、個々の機能や使い勝手を確かめていきました。

 そして、最終的に選定されたパブリッククラウドが、Microsoft Azure(以下、 Azure)です。

 湯原氏が一番の採用理由に挙げるのが、マイクロソフトのFastTrackサービスやCSAに代表されるサポート力の高さです。FastTrackはマイクロソフトの技術者が、企業でのクラウド展開策の立案から実装、ビジネス視点でのクラウドの価値最大化までを支援するサポートサービスです。

 「クラウドの開発でもオンプレミスと同様、自前による整備という基本方針を変えるつもりはありませんでした。新技術の知見獲得に役立つだけでなく、自ら整備を手掛けることで中身を把握でき、将来的な業務の見直しに際しても問題点や見直し方を容易に特定できるようになります。ただし、クラウド上での本格的なシステム構築は当社にとってこれが初めてのこと。何から始めるべきか分からないのが実情で、このままでは今後、何が分からないのかも分からないという状況に陥る可能性もありました。そんな私たちにとって、 FastTrack/CSAチームからの多面的な支援は、ゲノム解析基盤の確実な実装に向けた貴重な“知恵袋”と判断されました」(湯原氏)

 また、従来から業務基盤としてMicrosoft 365を採用しているH.U.グループ中央研究所では、Microsoft 365とAzureの連携性の高さ、特にシステム利用時のユーザーID連携やセキュリティ管理の面も将来的なゲノム解析基盤の機能向上に寄与するものとして高く評価したといいます。

モダンなシステム整備をマイクロソフトの知見が後押し

 Azureの採用を正式決定後、開発はいよいよ本格化します。作業は、H.U.グループ中央研究所がゲノム解析基盤上で実施したいことの概要を伝え、日本マイクロソフトが活用を見込める機能や使い方のアドバイスを行うというキャッチボールの繰り返しによりシステムの詳細を詰めつつ進められていきました。その過程では当初計画も少なからず見直されています。

 H.U.グループ中央研究所事業連携推進部バイオインフォマティクス課の久我有祐美氏は、「最初はクラウドの知見不足もあり、既存システムをクラウドに単純移行するだけでよいと考えていました」と打ち明けます。

 「しかし、クラウドにはリソースの柔軟な調整によりコストを最適化できるといったオンプレミスにはないメリットとともに、インターネットとつながることでの新たなリスクも存在します。それらについて日本マイクロソフトから指摘を受けつつ、システム設計や構築にあたってのアドバイスをもらうことで、リスクを抑えつつクラウドだからこそのモダンなシステムに仕上げていきました」(久我氏)

 モダン化の取り組みの1つが、多様な規模のHPCクラスターを柔軟に展開/活用するための「Azure CycleCloud」の採用です。

 すでに述べた通り、臨床検査ではシステムによる各種処理が不可欠ですが、オンプレミスではリソースの短期間での拡大は難しく、一定数までの解析しか対応することができません。逆に必要以上のリソースを用意した場合、通常は使われないことで無駄なコストが生じてしまいます。

 「Azure CycleCloudであれば、クラスターの任意サイズへの自動スケーリングにより、当社として悩ましかった解析数の変動にきわめて柔軟に、しかも最適なコストで対応できるようになります」(久我氏)

 一方で、ゲノム解析基盤のインタフェース開発には苦労したそうです。現場で作業を行う実験担当者の多くが、コマンドラインでの操作に慣れていないことが原因です。その点を踏まえ、作業の過程では一連の作業に携わる約10名の実験担当者と対話を繰り返して、ジョブを投入するためのGUI画面を作りこんでいったといいます。

 H.U.グループ中央研究所IT担当 田邊和豊氏は、「IT担当者は総じて社内の平準化された業務のシステム化は得意とするものの、最先端で要件も変わりやすい研究者向けシステム開発は残念ながら不得手です。しかも、ゲノム解析基盤で扱うデータ量は膨大で、どうバックアップすればいいかのアイデアもすぐには出てきませんでした。そうした中、日本マイクロソフトの多様な領域の技術者から数多くのアイデアが寄せられ、その質の高さに感心するとともに、安心して開発を進めることもできました」と語ります。

コロナ禍でのゲノム解析の急増に耐え得る新たな解析基盤

 ゲノム解析基盤の開発完了は2021年夏のこと。そこから季節をまたいだテストを終え、本番稼働を開始したのはオフィス移転と同時の2022年1月のことです。これを機に、H.U.グループ中央研究所でのゲノム解析にまつわる作業が新たな解析基盤上で実施されるようになり、データもクラウド上に集約されることで、当初の狙いであった地理的に離れた施設をまたぐ業務継続が実現しています。

 オンプレミスで問題だった運用工数も格段に削減されています。田邊氏は、「私たちが利用するストレージ容量は、一般企業と比べて桁が2つは違い、管理もそれだけ大変です。オンプレミス時代は作業にあたり、複数の担当者間で共用のストレージ容量の確認が求められ、そのことが作業の迅速さを削いでいました。しかし、クラウド移行により、ストレージ管理の手間が削減されただけでなく、容量不足時の追加も即座に行えるようになっています。作業のしやすさが格段に高まったことで研究開発は確実に加速しています」と笑顔で語ります。

 Azure CycleCloudの利用もあり、オンプレミスでは不可能であった検査量に柔軟に対応できるようにもなりました。

 「ゲノム解析は、がんや遺伝子疾患の原因遺伝子特定、腸内細菌の解析など、用途が急速に拡大しています。そうした中、新型コロナの登場により、新たな変異ウイルスの解析という、一時的に大量のリソースを必要とする作業も私たちに求められるようになりました。従来のオンプレミス環境であれば、依頼を断らざるを得ないケースもありました。しかし、Azure CycleCloudにより計算能力を即座にまかなうことで、従来は無理な業務量にも実際に対応できており、『Healthcare for You』を、より推進できるようになっています」(湯原氏)

他社との共同研究の“場”としての活用も視野に

 H.U.グループでは今回のプロジェクトを皮切りに、グループ全体の研究開発システムのクラウド化を推進する方針です。合わせて、ゲノム解析基盤の機能強化も推し進めるといいます。Microsoft 365やAzureの各種機能による操作画面の改善もすでに視野に入っています。

 「現状の画面はフルスクラッチで仕上げたものですが、操作と確認の双方で課題はいくつか残されています。Microsoft 365やAzureが提供する各種機能はそれらの改善で大いに活用を見込めます。方向性が固まり次第、開発に着手しようと考えています」(久我氏)

 その先に描く未来図が、ゲノム解析基盤をベースとする他社との協業です。その推進に向け日本マイクロソフトからアドバイスを得つつ、データ管理やセキュリティのあり方について議論を深めていくといいます。

 湯原氏は、ゲノム解析基盤の今後について次のように展望します。

 「Azureによるゲノム解析基盤の整備を通じて、変化が加速する中でのクラウドの重要性を改めて深く理解できました。一方で、クラウドはコスト負担や管理モデルがオンプレミスと異なり、さらなる活用に向けて準備期間も必要です。システムの運用を通じて知見が蓄積されれば、やるべきことも見えてくるはずです。研究機関である私たちのミッションは試し、確かめること。そのためのIT基盤の高度化に向け、日本マイクロソフトからの多面的なアドバイスを今後も引き続き期待しています」(湯原氏)