2019年3月26日 06:00
弊社刊「クラウド&データセンター完全ガイド 2019年春号」から記事を抜粋してお届けします。「クラウド&データセンター完全ガイド」は、国内唯一のクラウド/データセンター専門誌です。クラウドサービスやデータセンターの選定・利用に携わる読者に向けて、有用な情報をタイムリーに発信しています。
発売:2019年3月29日
定価:本体2000円+税
ヤフー株式会社
https://www.yahoo.co.jp/
「情報技術で人々や社会の課題を解決する」ことをミッションに掲げ、インターネットやスマートフォンの進化と共に成長を遂げてきた、日本最大級のポータルサイト「Yahoo! JAPAN」。近年では動画を多用したサービスの拡充や、ビッグデータのビジネス活用も積極的に推進している。そうしたサービスを根底から支えているのが、ヤフーのネットワークエンジニアだ。日々、増加し続けるトラフィックに対して、ヤフーはどのように対処しているのか。同社の取り組みから大規模ネットワーク運用の勘所を解き明かしていこう。
動画サービスの拡充とデータ分析の強化で社内外のトラフィックが急増
日本最大級のポータルサイト「Yahoo! JAPAN」の運営を中心に、ニュースやショッピング、オークションなど100以上にも及ぶサービスを展開する、大手ネットサービス企業のヤフー。近年では動画配信サービス「GYAO!」の強化や、ライブ動画配信サービス「ワイキュー」、ライブ配信で商品を紹介可能な「Yahoo!ショッピングLIVE」といった新たな動画コンテンツの創出に加え、Yahoo! JAPANの様々なサービスから得られたマルチビッグデータのビジネス活用にも積極的に取り組んでいる。
これらのサービス拡充に伴い、Yahoo! JAPANのデータセンターでやり取りされるトラフィックも増加の一途を辿り続けているという。テクノロジーグループ システム統括本部 サイトオペレーション本部 部長の村越健哉氏は、「データセンターのトラフィックは顧客にサービスを提供する『社外向け』と、ビッグデータ分析等の『社内向け』に大別されます。前者の場合、動画サービスの拡充に伴い、ピーク時には以前よりも数百Gbpsほど増加しています」と説明する。同部 リーダーの津秦知士氏も、「社内向けについてもビッグデータ分析の推進、およびそのための基盤強化に伴い、データセンター内に設置されたサーバー間通信のトラフィックが急増しています」と話す。
増加し続けるトラフィックに対して、ヤフーはどのように対処しているのか。ヤフーのネットワークエンジニアの取り組みを探っていこう。
最新技術を積極的に採用し急激なトラフィック増に対応
はじめに社外向けのトラフィックだが、ヤフーでは、ネットワーク設備のキャパシティの50%以下でトラフィックに対処することを前提条件とし、サービスの追加や拡充でその値を超えることが予期された場合には、ネットワークインターフェースの増速や機器の増設といった「スケールアウト」による対応を行っている。ここで重要となるのが「常日頃からサービス部門と密なコミュニケーションをとること」と、村越氏は強調する。
「定期的にサービス部門にヒアリングをして、サービスの状況や今後の新サービスの計画をあらかじめ把握し、サービス側が求めるトラフィック要件に対して、必要なタイミングでネットワークの拡充を行ったり、時には外部サービスを利用したりするなどの対応にあたれるようにしています。文字通り、ネットワークは“繋がり”であり、サービスレベルの維持、強化には関係部署や担当者とのコミュニケーションが欠かせません」(村越氏)
また、ネットワーク機器の調達でも、SIベンダー等の社外パートナーとのコミュニケーションを密にし、適切なタイミングで機器の導入が行えるようにしている。さらに海外で注目を集めている新技術や新製品などの情報交換も積極的に行い、時には先行して検証を実施するなど、技術のブラッシュアップにも繋げているという。
一方、社内向けトラフィックの増加への対応では、データセンター内のサーバーや機器間のトラフィックの増加に応じて、各種リソースを柔軟にスケールアウト可能な「Clos Fabric Network」の導入を2016年から推進している(図1)。
津秦氏は、「従来型のネットワークは基本的に『アクティブ-スタンバイ』の構成を採用しており、ラックとコアスイッチ間のアップリンクを2系統用意しても、1系統しか使えずボトルネックになるケースが発生していました。対して、Clos Fabric Networkであれば技術上、より多くのアップリンクを結ぶことが可能です。これにより、異なるラックに設置されたサーバー間通信の帯域幅を大幅に増強できています」と話す。なお、ヤフーでは、ビッグデータ分析の利用増に応じ、Clos Fabric Network環境の帯域幅も増強。従来、4本の40Gbps回線で構成されていた環境を、4本の100Gbps回線に増速している。このほかにも、Clos Fabric Networkはスイッチの増設が従来型のネットワークに比べて柔軟かつ容易であるため、システム増強にかかる作業負荷も軽減できているという。
さらにネットワーク基盤の安定運用を支えるためにヤフーが積極的に採用しているのが、自動化の仕組みだ。村越氏は、「自動化ツールを内製するだけでなく、商用のツールも導入し、運用の自動化に取り組んでいます。運用にかかる負荷や時間が抑制されれば、本来の業務であるツールの開発や新技術の検証に多くの時間を充てられるようになります。また、人手によるエラーを回避できることも自動化のメリットです」と強調する。津秦氏も「実際、運用の自動化を進めたことによって、Clos Fabric Networkにおけるスイッチ増設の作業が、従来では1週間程度かかっていたところを数時間で終えられるようになるなど、工数を大幅に減らせています」と、その効果を話す。
様々なチャレンジを可能とするYahoo! JAPANのネットワーク
最新技術も活用し、増加するトラフィックに対処するヤフー。同社のエンジニアとしてのやりがいについて、村越氏は次のように話す。
「これだけ膨大な量のトラフィックを扱っている事業者は、国内では他に例がありませんし、ニュースや動画配信など、世の中に大きな影響を与えるサービスを自分が支えていることに大きなやりがいを感じています。また、新しい技術や製品をいち早く取り入れた、世界でも最先端のネットワークシステムを手掛けられていることも、エンジニアとしての大きなモチベーションになっています」(村越氏)
津秦氏も「新技術を採用した革新的なデータ分析基盤を構築し、それを世の中に発信できることに、大きな喜びを感じています」と語る。
エンジニアにとっても多くのチャレンジが行える“場”を提供するヤフーでは、共に仕事を行っていける人材を常に求めているという。村越氏は、「様々な物事に自ら積極的に取り組むような、好奇心の強い人に仲間になってもらえると嬉しいですね。そうした人にとっても、ヤフーは挑戦する機会を与えてくれる企業であると思います」と強調する。津秦氏も「ネットワークだけでなく、様々な経験を持った人材を求めています。私のチームには、決済アプリケーションの開発経験を持つメンバー等、様々な経歴をもったエンジニアが集まっています。そうした多様な人材が集まることで、ネットワークを多面的に捉えられるようになり、ひいてはインフラの改善にも繋がっていきますからね」と語る。
最後に村越氏は、今後のネットワーク強化に向けた展望について、「まずは、従来型のネットワークを順次、Clos Fabric Networkへと移行していく計画です。将来的には、ネットワークだけでなくソフトウェアやサーバーも含め、データセンター全体をトータルで制御可能な基盤を実現していきたいと考えています」と意欲を見せた。