ニュース
グーグル、クラウド型DWHサービス「BigQuery」を東京リージョンで提供開始
みずほ銀行はαテストでPoCを実施
2018年4月20日 06:00
グーグルは18日、Google Cloud Platform(GCP)の東京リージョンにおいて、データウェアハウス(DWH)サービス「BigQuery」の提供を開始することを発表した。
GCPは現在15リージョンで提供されており、ほかに建設中のリージョンが4つある。国内では2016年11月に東京リージョンの提供を開始。2019年内には、大阪リージョンが開設予定になっている。
今回、東京リージョンでサービスが開始されるBigQueryは、クラウド型のDWHサービス。その特徴について、Google Cloud カスタマーエンジニアの寳野雄太氏は、「フルマネージドなSaaS型DWHのため、運用の人員やリソースが不要。従量課金のため低コスト。大規模なデータ分析に対応しており、1つのストレージで社内のすべてのデータを扱えるため、社内のデータ流通を促進する。PB級のデータを一瞬で解析可能で、10億行のアクセスログであっても、2~3秒で解析できる」と説明した。
また寳野氏は、BigQueryの利用イメージとして、データレイク(オブジェクトストレージ)である「Google Cloud Storage」に保存されている非構造化データを、データクレンジングサービス「Cloud Dataprep」で分析可能な構造化データへと加工し、DWHのBigQueryで処理するという流れを示す。
その上で、「東京リージョンのGoogle Cloud Storageから東京リージョンのBigQueryへ投入すれば、データを国内にとどめたまま大規模データを高速に処理できる」と説明。
さらに、専用線接続サービス「Innterconnect」や、仮想プライベートクラウドの「VPC Service Control」と組み合わせることにより、パブリックなネットワークを介さずに、オンプレミスからBigQueryを利用したデータ分析も可能となることから、機密性の高いデータは国内でしか扱えないというポリシーの企業にとっても、データ活用の機会が拡大することになるとアピールした。
みずほ銀行が実証実験の中身を説明
今回の発表に先駆け、アスクル、NTT Com、ソフトバンク、野村総合研究所、みずほ銀行、LIXIL、リクルートテクノロジーズなどが、アルファテスターとして、東京リージョンのBigQueryを利用した実証実験を行ったという。
記者説明会にはその中からみずほ銀行の担当者が登壇し、実証実験の内容を紹介した。
みずほ銀行では、データ分析環境としてオンプレミスにDWHを構築し、SQLクエリを実行している。現状のデータ分析環境では、1日に処理できるデータ分析の処理能力に上限があり、分析者はこの上限に合わせた分析しか行うことができなかった。
みずほ銀行 個人マーケティング推進部 参事役 シニアマネージャーの黒須義一氏は、この課題を解決するためにクラウドサービスを利用できないかと考え、以前からGCPのBigQueryに興味を持っていたこともあり、グーグルに問い合わせた。そこで東京リージョンでBigQueryが利用可能になることや、アルファテストが実施されることを知り、実証実験を行うことにしたという。
なお黒須氏は、いまのところ、「法令などで定められた、国内でのみ取り扱うことができる機密性の高いデータを分析する予定はない」と説明したが、その一方で「パブリッククラウドを利用するにあたり、行内で理解を得るためには、国内リージョンでのみデータが扱えることは重要だった」とも述べている。
実証実験では、行内システムからGoogle Cloud Storageにデータを手動でコピーし、BigQueryの大量データ処理や多重処理などの性能検証、およびDataprepの性能検証が行われた。
みずほ銀行 IT・システム統括第一部 戦略情報基盤システム推進チーム 調査役の家村育民氏は、今回の実証実験の結果について、「データ処理の並列度を上げても高いパフォーマンスを維持できることが確認できた。今後DWHの利用者が増えれば処理の並列度も増していくことになるため、大きなメリットだ」と述べた。
さらに黒須氏は今回の検証結果について、「BigQueryやDataprepはプログラミング不要で、ユーザー部門はデータ分析に集中できることが分かった」と述べた。さらに黒須氏はデータ分析にかかるコストは、現行オンプレミスの環境と比較すると、3分の1から4分の1に削減できるという試算も明らかにしている。ただし、あくまでも実証実験であり、今後みずほ銀行がBigQueryを実導入するかどうかは未定であるという。