ニュース

グーグル、クラウド型DWHサービス「BigQuery」を東京リージョンで提供開始

みずほ銀行はαテストでPoCを実施

 グーグルは18日、Google Cloud Platform(GCP)の東京リージョンにおいて、データウェアハウス(DWH)サービス「BigQuery」の提供を開始することを発表した。

 GCPは現在15リージョンで提供されており、ほかに建設中のリージョンが4つある。国内では2016年11月に東京リージョンの提供を開始。2019年内には、大阪リージョンが開設予定になっている。

現在提供中のGCPリージョンが15、建設中のリージョンが4。2019年には大阪リージョンが開設予定だ

 今回、東京リージョンでサービスが開始されるBigQueryは、クラウド型のDWHサービス。その特徴について、Google Cloud カスタマーエンジニアの寳野雄太氏は、「フルマネージドなSaaS型DWHのため、運用の人員やリソースが不要。従量課金のため低コスト。大規模なデータ分析に対応しており、1つのストレージで社内のすべてのデータを扱えるため、社内のデータ流通を促進する。PB級のデータを一瞬で解析可能で、10億行のアクセスログであっても、2~3秒で解析できる」と説明した。

Google Cloud カスタマーエンジニア 寳野雄太氏
東京リージョンにおいて、BigQueryの提供を開始
BigQueryは大規模データデータ分析に対応したDWHのクラウドサービス。PB級のデータも一瞬で解析可能だという

 また寳野氏は、BigQueryの利用イメージとして、データレイク(オブジェクトストレージ)である「Google Cloud Storage」に保存されている非構造化データを、データクレンジングサービス「Cloud Dataprep」で分析可能な構造化データへと加工し、DWHのBigQueryで処理するという流れを示す。

 その上で、「東京リージョンのGoogle Cloud Storageから東京リージョンのBigQueryへ投入すれば、データを国内にとどめたまま大規模データを高速に処理できる」と説明。

 さらに、専用線接続サービス「Innterconnect」や、仮想プライベートクラウドの「VPC Service Control」と組み合わせることにより、パブリックなネットワークを介さずに、オンプレミスからBigQueryを利用したデータ分析も可能となることから、機密性の高いデータは国内でしか扱えないというポリシーの企業にとっても、データ活用の機会が拡大することになるとアピールした。

Google Cloud データソリューション利用イメージ

みずほ銀行が実証実験の中身を説明

 今回の発表に先駆け、アスクル、NTT Com、ソフトバンク、野村総合研究所、みずほ銀行、LIXIL、リクルートテクノロジーズなどが、アルファテスターとして、東京リージョンのBigQueryを利用した実証実験を行ったという。

 記者説明会にはその中からみずほ銀行の担当者が登壇し、実証実験の内容を紹介した。

 みずほ銀行では、データ分析環境としてオンプレミスにDWHを構築し、SQLクエリを実行している。現状のデータ分析環境では、1日に処理できるデータ分析の処理能力に上限があり、分析者はこの上限に合わせた分析しか行うことができなかった。

 みずほ銀行 個人マーケティング推進部 参事役 シニアマネージャーの黒須義一氏は、この課題を解決するためにクラウドサービスを利用できないかと考え、以前からGCPのBigQueryに興味を持っていたこともあり、グーグルに問い合わせた。そこで東京リージョンでBigQueryが利用可能になることや、アルファテストが実施されることを知り、実証実験を行うことにしたという。

 なお黒須氏は、いまのところ、「法令などで定められた、国内でのみ取り扱うことができる機密性の高いデータを分析する予定はない」と説明したが、その一方で「パブリッククラウドを利用するにあたり、行内で理解を得るためには、国内リージョンでのみデータが扱えることは重要だった」とも述べている。

みずほ銀行 個人マーケティング推進部 参事役 シニアマネージャー 黒須義一氏

 実証実験では、行内システムからGoogle Cloud Storageにデータを手動でコピーし、BigQueryの大量データ処理や多重処理などの性能検証、およびDataprepの性能検証が行われた。

 みずほ銀行 IT・システム統括第一部 戦略情報基盤システム推進チーム 調査役の家村育民氏は、今回の実証実験の結果について、「データ処理の並列度を上げても高いパフォーマンスを維持できることが確認できた。今後DWHの利用者が増えれば処理の並列度も増していくことになるため、大きなメリットだ」と述べた。

みずほ銀行 IT・システム統括第一部 戦略情報基盤システム推進チーム 調査役 家村育民氏
みずほ銀行で行われた実証実験の内容
データ処理の並列度を上げてもパフォーマンスが維持されることを確認

 さらに黒須氏は今回の検証結果について、「BigQueryやDataprepはプログラミング不要で、ユーザー部門はデータ分析に集中できることが分かった」と述べた。さらに黒須氏はデータ分析にかかるコストは、現行オンプレミスの環境と比較すると、3分の1から4分の1に削減できるという試算も明らかにしている。ただし、あくまでも実証実験であり、今後みずほ銀行がBigQueryを実導入するかどうかは未定であるという。

検証の結果と今後の期待効果