ニュース

グーグルがGoogle Cloud Next '21の発表を解説、データクラウド/オープンクラウドの両分野で

BigQueryやLooker関連、“サーバーレスSpark”など

 Google Cloudの年次カンファレンスイベント「Google Cloud Next '21」が、米国時間の10月12日から14日までオンラインで開催されている。

 初日のあと、グーグル・クラウド・ジャパン合同会社が日本向けに記者説明会を開催。発表された新サービスのうち、主にデータクラウドおよびオープンクラウドにおける発表について解説した。

 この記事では、日本の記者説明会で紹介された新発表についてレポートする。なお、先日の事前ブリーフィングにおける新発表と一部重複するものもあるが、それ以外のものも含まれる。

「Googleにデータを預けることでデータ活用が可能になる」

 まず、グーグル・クラウド・ジャパンの寳野雄太氏(技術部長(アナリティクス/機械学習、データベース))が、Google Cloudの現在のミッションとして、「お客さまのビジネスのデジタル変革を実現する」を掲げた。

グーグル・クラウド・ジャパンの寳野雄太氏(技術部長(アナリティクス/機械学習、データベース))

 そのうえで、Google Cloud NextのキーノートセッションでもGoogle CloudのCEOのThomas Kurian氏が挙げたユーザー企業事例を紹介した。

 まず、ホームセンターのThe Home Depotは、コンタクトセンター向けのContact Center AI Agent Assistを採用し、顧客の問い合わせの解決までの時間を9100万時間削減した。

 製造業のFoxconnは、外観検査のVisual Inspection AIを採用し外観検査の精度を10倍に改善した。

 家具のIkea Retailは、商品レコメンデーションのRecommendations AIを採用し、30%のクリックスルーレート向上と、オーダーあたり価格の2%増加を実現した。

 こうしたデータソリューションの利用事例を受けて、寳野氏は「Googleにデータを預けることでデータ活用が可能になる。それがわれわれのビジョンだ」と語った。

The Home DepotのContact Center AI Agent Assistの事例
FoxconnのVisual Inspection AIの事例
Ikea RetailのRecommendations AIの事例

データクラウド関連:SpannerのPostgreSQLインターフェイスや、サーバーレスSparkなど

 続いて寳野氏は、データクラウド関連の新発表を紹介した。

BigQuery Omniが一般提供開始

 BigQuery Omniが一般提供開始された。2020年7月に発表された機能で、BigQueryから、AWSのS3やAzureのBlob Storageに置かれたデータも統合して利用できるサービスだ。

 一般提供開始にあたっては、他クラウドにあるデータをある程度集計してからGCPのデータと結合するクロスクラウドデータ転送(近日追加予定)や、マルチクラウドを一元的なビューで閲覧するようクロスクラウドマテリアライズドビューの拡充(ロードマップ段階)も発表した。

BigQuery Omniの一般提供開始

BigQuery外部関数:BigQuery内部でCloud Functionsの関数を呼び出す

 BigQuery外部関数が発表された。近日追加予定。BigQueryに内蔵されたJavaScriptやSQLによるユーザー関数定義に加えて、FaaSサービスのCloud Functions上の外部関数を呼び出し、BigQuery内部のデータを処理できる。例えば、Cloud Functions上の関数かららに外部のAPIを呼び出して、自然言語処理などを行えるという。

BigQuery外部関数

BigQuery検索インデックス

 BigQuery検索インデックスが発表された(プレビュー)。BigQueryは、集計は得意だが、特定の1行を取り出すような処理には改善の余地があり、それを、インデックスを作成して対応するという。

 これとあわせて、ネイティブJSON型への対応も発表された(プレビュー)。

BigQuery検索インデックス

Dataplexの一般提供開始

 Dataplexも一般提供開始となった。Dataplexは、さまざまなデータを移動せずに統合するデータファブリックで、統合的なデータの管理を提供する。

Dataplexの一般提供開始

Spark on Google Cloud:サーバーレスSpark

 Spark on Google Cloudが発表された(プレビュー)。ビッグデータ処理のApache Sparkを自分でクラスターを立てずに動かせるもので、ジョブを投入すると勝手にスケールして動作するという。Google Cloudでは「サーバーレスSpark」と形容している。

 このSpark on Google Cloudを使って、BigQueryから簡単にSparkのジョブを実行する機能も発表された(近日追加予定)。Sparkからは、BigQueryのStorage APIを利用して高速にデータを参照するという。

 同様に、DataplexからもSparkのジョブを利用できるようにする機能も発表された(近日追加予定)。

Spark on Google Cloud
BigQueryを通じたSpark
Dataplexを通じたSpark

Spanner PostgreSQL interface:SpannerをPostgreSQLのインターフェイスで

 フルマネージドで自動的にスケールするリレーショナルデータベースCloud Spannerでは、「Spanner PostgreSQL interface」が発表された。Cloud SpannerにおいてPostgreSQLの高機能なSQLをサポートするほか、コマンドラインクライアントのpsqlに対応する。今後、PostgreSQL対応のO/Rマッパーやツール、あるいはPostgreSQLの高度な機能などに、顧客のフィードバックを見ながら対応していく、と寳野氏は説明した。

Spanner PostgreSQL interface
PostgreSQLのpsqlからSpannerを使うデモ(Google Cloud Next '21のセッションより)

LookerがGoogleスプレットシートなどと統合

 Google CloudのBIとデータマネジメントのツール「Looker」については、3点の発表が紹介された。

 まず、「Looker+コネクテッドシート」として、GoogleスプレッドシートからBigQueryなどの処理を呼び出すコネクテッドシートにおいて、Lookerのセマンティックモデルを参照してデータを探索することに対応する

 また、「Contact Center AI向けのLookerソリューション」と「Helthcare NLP API用Looker Blocks」として、コンタクトセンターやヘルスケアのデータからLookerによって洞察を得られるようになるという。

Lookerの発表3点

Vertex AI Workbench:ノートブックからVertex AIやBigQueryを利用

 Vertex AI Workbenchが発表された(プレビュー)。VirtexAIは、機械学習においてAutoMLとカスタムトレーニングの両方に対応し、MLOpsまでのフルサイクルをサポートする統合プラットフォーム。Vertex AI Workbenchは、ノートブックのインターフェイスで、Vertex AIやBigQueryなどを使ったデータ処理やトレーニングなどをすべてカバーするという。

 また、Vertex AI Workbenchでは、Spark on Google Cloudにも対応する(近日追加予定)。Workbenchの中からSparkのジョブを作成してサーバーレスSparkで実行できる。

Vertex AI Workbench
Vertex AI Workbenchを通じたSpark on Google Cloud

オープンクラウド関連:Google Cloudのインフラをエッジやオンプレミスに

 オープンクラウド分野の新発表については、グーグル・クラウド・ジャパンの安原稔貴氏(技術部長(インフラ、アプリケーション開発))が紹介した。

グーグル・クラウド・ジャパンの安原稔貴氏(技術部長(インフラ、アプリケーション開発))

Google Distributed Cloud:Google Cloudをエッジやオンプレミスで

 Google Distributed Cloudが発表された。Google Cloudのインフラやサービスを、Googleのネットワークエッジや、通信事業者のエッジ、顧客企業のエッジ、顧客企業のデータセンターで動かすものだ。

 「フルマネージドハードウェアとソフトウェアソリューション」と形容され、パートナーのハードウェアの上に、Anthosを基盤として各種サービスを動かす。

 エッジ向けの「Google Distributed Cloud Edge」(プレビュー)と、データセンター向けの「Google Distributed Cloud Hosted」(近日公開予定)の2つのサービスがある。

 Google Distributed Cloud Edgeは、例えば通信キャリアの5GのコアやRAN、あるいは製造業の工場などでAIを動かすような、比較的ライトな処理のユースケースを想定しているという。

 Google Distributed Cloud Hostedは、オンプレミスのデータセンターに設置し、Google Cloudとの接続なしに動作するもの。国防上の理由やデジタル主権のニーズなど、政府などのパブリックセクターでの用途を想定しているという。これに関連して、ヨーロッパでパートナーシップ「Cloud. On Europe's Terms」イニシアチブもアナウンスされ、ヨーロッパの政府や大企業との信頼を築くとしている。

Google Distributed Cloud Edge
Google Distributed Cloudの概要

気候変動対策関連の新発表

 安原氏は、気候変動対策関連の新発表についても紹介した。

 Google Cloud Carbon Footprint(プレビュー)は、Google Cloudのユーザーがリソースを使っていることによる炭素排出量をダッシュボードで確認できるものだ。

 Carbon Reduction Recommendations(プレビュー)は、利用されていないプロジェクトの削除を提案することで、炭素排出量を削減する。

 Google Earth Engine for Google Cloud customers(プレビュー)は、衛星写真や地理情報、気候に関わるものなどのデータセットGoogle Earth Engineを、BigQueryやCloudAIと組み合わせて、気候変動に対応するようなものを考えてもらうものだという。

Google Cloud Carbon Footprint
Carbon Reduction Recommendations
Google Earth Engine for Google Cloud customers