ニュース
グーグル・クラウド、Google Cloud Next '22での主要トピックを解説 BigQueryの非構造化データサポートなど
2022年10月14日 06:15
Google Cloudの年次カンファレンスイベント「Google Cloud Next '22」が、日本時間の10月12日~14日にオンラインで開催されている。
ここでは、Google Cloud Next '22でのクラウドサービスの発表から主要なトピックについて、より詳細に解説した日本での記者説明会の模様を紹介する。なお発表内容自体については、すでに本誌でレポートした日本向け基調講演と重複するものもあるのでご了承いただきたい。
Google Cloudでは顧客企業のDXを支援する「トランスフォーメーションクラウド」を戦略に掲げており、その中で「データクラウド(Intelligence)」「オープンクラウド(Modernization)」「コラボレーションクラウド(Hybrid Workplace)」「トラステッドクラウド(Cybersecurity)」を推進している。記者説明会では、このうちデータラウド、オープンクラウド、トラステッドクラウドの3つの分野におけるGoogle Cloud Next '22での発表が解説された。
データクラウド:AIやBigQuery、BIなどの新機能
データクラウドの分野については、グーグル・クラウド・ジャパン合同会社 ソリューション&テクノロジー部門 技術部長(DB, Analytics & ML)の寳野雄太氏が解説した。
寳野氏は、企業でデータ活用がなかなか進まないという課題を抱えているという調査結果を紹介した。その要因として、従業員のスキルが追いついてこないという「スキルギャップ」、構造化データや非構造化データなどさまざまなデータが混在する「データの複雑性」、データを使うユーザーをどれだけ増やせるかという「スケール」の3つを指摘。そして、それぞれの課題に対するGoogle Cloud Next '22での発表を紹介した。
AI利用のスキルギャップを埋めるTranslation HubやVertex AI Vision
まずはスキルについて。Google CloudではクラウドAIの利用方法としてこれまで、画像認識などのように学習済みモデルとAIソリューションをそのまますぐ使えるサービスや、自分のモデルやAIを作るための開発ツール、そしてその中間として、AutoMLやBigQuery MLを利用したカスタムAIの3種類を提供してきた。
ここに新たにもう1つの選択肢を加え、多くのユーザーのスキルギャップを埋めると寳野氏は述べた。
この分野の発表の1つめは、ドキュメント翻訳AIサービスの「Translation Hub」だ。PowerPointなどさまざまなフォーマットの文書を、レイアウトを保ったままセルフサービスで翻訳できる。同様のことをするのに、これまではTranslation APIを提供していたが、使うには開発者がプログラムを作る必要があった。
これを誰でもリッチなUIから、エンタープライズレディなツールとして使えるようになった、と寳野氏は意義を説明した。
2つめは、画像/動画AIアプリケーションを、より簡単に開発しデプロイする「Vertex AI Vision」だ。例えば動画から洞察を得るプログラムを開発するには、AIの機能は既存のサービスを使うとしても、動画の取り込みの部分や、画像をAIにかける部分など、さまざまな開発が必要だった。
そこでVertex AI Visionでは、さまざまな処理をクリックで選んだり、例えば画像中の車の数をカウントする処理を指定したり、BigQueryに取り込んだりといった処理を、GUIだけで開発できるようになる。これによって、活用が難しかったデータの活用が進むと考えている、と寳野氏は語った。
複雑性のギャップを埋める、BigQueryの非構造化データ対応や、RDBMSからBigQueryへのニアリアルタイムレプリケーション
次はデータの複雑性について。
寳野氏は今回のAIのアップデート全般について、企業にある画像や動画などの非構造化データをより使いやすくするものが多かったと語った。
その1つに、BigQueryの非構造化データのサポートが発表された(プレビュー)。BigQueryはこれまでデータウェアハウスと言われてきたが、データレイクも統合してSQLで操作できるようになった、と寳野氏は言う。
また、BigQueryによるSQLを超えた分析ユースケースをサポートする「Spark in BigQuery」が発表された(プレビュー)。市場のニーズで、クエリでPythonやSparkを使いたいという声があったという。また、オープンな技術と統合したいという声もあったという。例えば、データのクレンジングにSparkを使う用途があるが、それもBigQuery上でできるようになったと寳野氏は語った。
同様に、Sparkでよく使われるテーブルフォーマットのApache Icebergのサポートも発表された(プレビュー)。
なお、これらは課金体系もBigQueryに統合される。
一方、トランザクションデータベースのデータについては「Datastream for BigQuery」が発表された(プレビュー)。RDBMSのトランザクションデータベースから、データをワンタッチでBigQueryにニアリアルタイムでレプリケーションできる。これにより、トランザクショナルなシステムからBigQueryにデータ連携してリアルタイムで分析できるという。
またクラウドRDBMSであるAlloyDBおよびCloud Spannerでの機械学習モデル対応も発表された。Vertex AIなどで作成した機械学習モデルを、SQLからML_PREDICTといった関数で呼び出せる。例えば、ECサイトの注文処理の中でクレジットカードの不正検知を利用するといったことに使えるという。
スケールのギャップを埋める、Lookerポートフォリオの再編や、コネクテッドシートのGA
データ活用をスケールされる中で重要なのが、可視化やBIだと寳野氏は言う。
この分野で新しく、旧GoogleデータスタジオをLookerのポートフォリオに統合して、セルフサービスBIツール「Looker Studio」として提供する。
この背景として、BIには2つの相反するユースケースがあると寳野氏。1つは、個人やチームですばやくデータを扱う、セルフサービスBIだ。もう1つは、誰が入れたかわからないような信頼性が高くないデータなどがないようデータガバナンスを効かせた、集中管理BIだ。
集中管理BIに相当するのが従来のLookerであり、セルフサービスBIに相当するのが旧Googleデータスタジオだ。これを、GoogleデータスタジオをLooker Studioにすることで、Lookerポートフォリオに統合する。
そして、新たに「Looker Studio Pro」が発表された。Looker Studioを元に、有償でサポートやSLAを、豊富なアクセス管理などのエンタープライズ機能を加えている。
そのほか、Googleスプレッドシート上からBigQueryで分析する「コネクテッドシート」がGA(一般提供開始)となった。GAにすると同時に、すべてのGoogle Workspaceプランおよび個人でも使えるようになった。
オープンクラウド:AI、HPC、VMware環境、セキュリティを確保した開発など
オープンクラウドの分野については、グーグル・クラウド・ジャパン合同会社 技術部長(インフラ、アプリケーション開発)の安原稔貴氏が解説した。
TPU v4やGoogle BatchのGA
AIインフラの分野では、機械学習チップTPUの最新版「Cloud TPU v4」がGAとなった。従来に比べて最大80%速く、50%以上のコスト削減を実現するという。そのほかAIハードウェアには、NVIDIA A100 GPUのメモリを拡張した「A2-ultra」GPUがある。
また、「Google Batch」がGAとなった。GPUのジョブをバッチで実行できるジョブスケジューラだ。
C3インスタンスやストレージのAutoclass機能
大規模なデータ集約型アプリケーションには、仮想マシンインスタンスの種類で「C3」が登場した。CPUにIntelのSapphire Rapidsを搭載。さらにIntelと共同開発したInfrastructure Processing Unit(IPU)により、通信などのインフラ制御をオフロードできる。
同時に「Google Cloud Hyperdisk」も発表された。次世代の永続ブロックストレージで、インスタンスタイプによってはIOPSが80%以上向上するという。インスタンスのタイプやサイズに依存せず利用できる。
クラウドストレージについては、「Autoclass」機能が追加された。使われていないデータなどを自動的に、ニアラインやコールドライン、アーカイブなど、最適なストレージクラスに移動する。早期削除や取得料金のコストは発生せず、クラス移行料金も必要ない。
Google Cloud VMware Engineのアップデート
Google Cloud上でVMware vSphere環境を動かす「Google Cloud VMware Engine」については、3点が紹介された。
まずは従来の64ノードから、96ノードまで拡張可能になった。また、100Gbpsネットワークが利用可能になった。さらに、VMware社のVMware Cloud Universalプログラムへの参加し、VMware Cloud UniversalのコンソールからGoogle Cloud VMware Engineのインスタンスを操作できるようになった。
ライフサイクルにわたってセキュリティを確保するSoftware Delivery Shield
セキュリティ面では、開発ライフサイクル全体にわたってセキュリティを確保するための「Software Delivery Shield」が発表された。単体の製品ではなく組み合わせでセキュリティを確保するもので、一度にすべてではなく段階的に取り入れることもできる。
その中から安原氏は2つをピックアップして紹介した。
1つめは、コンテナベースの開発環境がすぐに用意でき、ブラウザ上のIDEで開発できる「Cloud Workstations」だ(プレビュー)。環境の中のセキュリティポリシーを適用できるほか、VPC内でも実行できる。
2つめはGKE(Google Kubernetes Engine)の追加機能である「GKE security posture management」だ(プレビュー)。コンテナイメージなどの脆弱性や構成ミスをチェックできる。仕様はオープンになっていて、SIEMなどほかのセキュリティツールと統合することもできるという。
クラウド移行ツールや、Anthosのアップデートなど
クラウド移行には、「Migration Center」が発表された(プレビュー)。マイグレーションのいくつかのツールを集約したハブで、これによって簡単にクラウドに移行できるという。例えば、データにもとづいて構成を提案したり、仮想マシンをクラウドに持っていくだけでなくコンテナやサーバーレスへの移行を計画したりもできるという。
また、「Workload Manager for SAP Workloads」(プレビュー)は、自動的にSAPの構成を可視化できるツールだ。
「SQL analysis of log through BigQuery」(プレビュー)はクラウドロギングの機能だ。アプリケーションのログは膨大になるため、それをBigQueryでクエリできるようにする。
Anthosのアップデートとしては、新しいクラウドベースのUIと、複数のKubernetesクラスタを管理するダッシュボード、Anthos for VMsでVMをインポートできるようになったこと、Anthos以外のKubernetesクラスタを管理するAnthosアタッチクラスタへの機能追加の4つを安原氏は紹介した。
セキュリティクラウド:Mandient社の買収完了、Chronicleセキュリティオペレーション、コンフィデンシャルスペース
最後のセキュリティクラウドについては、グーグル・クラウド・ジャパン合同会社 執行役員 ソリューションズ & テクノロジー担当の菅野信氏が解説した。
まず、前週にMandient社の買収を完了したことを説明した。一体となってセキュリティ運用をモダナイズするという。より具体的には、脅威インテリジェンスの向上、SecOpsの強化、Mandientの専門知識の活用のさらなる応用という3つの分野に取り組む。
また今回のGoogle Cloud Next '22では、「Chronicleセキュリティオペレーション」を発表した。SIEMと、SOAR、Google Cloudが提供する脅威インテリジェンスの3つを統合した、クラウドベースのプロダクトスイートだ。統一されたUIでセキュリティのオペレーションをわかりやすく管理できるという。
Googleは処理中もデータを暗号化するコンフィデンシャルコンピューティングの最初のプロダクトとして、2年前に「コンフィデンシャルVM」を発表した。今回のGoogle Cloud Next '22では次の段階として、新しく「コンフィデンシャルスペース」が発表された。機密データの秘匿性やコントロールを維持しながら、外部の組織と共同作業できる。