イベント
画像に似ているコマをマンガからマルチモーダル検索するデモなど、生成AI関連の展示を紹介
~Google Cloud Next Tokyo '23
2023年11月17日 06:00
Google Cloudの日本での年次カンファレンス「Google Cloud Next Tokyo '23」が、11月15日~16日に、東京ビッグサイトで開催された。2019年に続き、3年の間を置いてのリアル開催となる。
本記事では、展示会場でのGoogleによる生成AI関連の展示を、プレスツアーの模様を元にレポートする。
「ONE PIECE」コスプレ写真から似ているコマをマルチモーダル検索
まず面白い例として、「集英社「ONE PIECE」で体験するマルチモーダルAI」というコーナーから紹介しよう。
これは、人気マンガ「ONE PIECE」風アイテムを人が身につけた様子をカメラで撮影すると、現在107巻におよぶ「ONE PIECE」のコマの中から似ているコマを検索してくれるというデモだ。撮影された画像に対しては説明文がAIで生成され、その画像とテキストの両方を使って検索がなされるという、“マルチモーダル”な検索となっている。
下に載せた写真の例では、「a man wearing a straw hat and a black jacket(麦わら帽と黒いジャケットを身につけた男性)」という説明が生成され、画像に似たコマが12点選ばれた。ポーズは違うが帽子と黒いジャケットを身につけたコマもあれば、反対に帽子や服の色は違うがなんとなく似ているコマもある。
ブースでの説明によると、仕組みとしては、画像とテキストをエンベディング(ベクトル化。数値化してN次元空間の座標に変換)して、マンガのコマ画像との距離の近さ(意味などの類似度)で検索するとのことだった。
オフィススイートGoogle Workspaceに生成AI機能をアドオン
一般ビジネスマンにとって身近なのは、「Duet AI in Google Workspace」のコーナーだろう。クラウド上のオフィススイート「Google Workspace」に、生成AIの機能をアドオンで追加するものだ。「Duet AI」とは、秘書のように生成AIが作業を助けてくれることを意味するという。ありていに言ってしまうと、Microsoftの「Microsoft 365 Copilot」のようなものだ。
ブースでは、プレゼンソフトのGoogleスライドで、対話形式により概要と元になるスライドから新しいスライドを作るところや、スライドの内容から画像を生成するところをデモしていた。
また、ワープロソフトのGoogleドキュメントでは、対話形式により米国のブログをベースに日本語ブログ記事を書いたり、その文章について文章のトーンを変えたり、タイトルを提案してもらったりといったところをデモした。
さらにビデオ会議のGoogle Meetでは、国際的な会議の中でほかの言語で発言した人を自動検出して翻訳字幕をつけるところや、会議内容のサマリー文書を作成してGoogleドキュメントに保存するところをデモした。
BIツールでの分析やレポートも生成AIが自然言語から支援
Duet AIは、BIツール「Looker Studio」にも対応する。「生成AIでデータ分析・活用を加速するSmart Analytics」のコーナーでは、Looker Studioの有料版「Looker Studio Pro」で使えるようになる生成AI機能「Duet AI in Looker」などについて説明していた。
Looker Studioから自然言語の対話形式で、可視化をしたり、考察を含むレポートスライドを生成したりできる。また、BigQueryでほかの人が書いたクエリーSQLの意味を質問したり、SQLを生成したりもできる。
SQLのスキルがなくても自然言語からクエリーを生成してデータ分析
生成AIを使ったデータ分析としては、SQLのスキルを持たない人でも自然言語でクエリーのSQLを作って分析できるものを、「Codeyを活用した自然言語によるデータ分析」のコーナーでデモしていた。
これは、Googleの大規模言語モデル「PaLM 2」をベースにコード生成用に作られたAIモデル「Codey」を使ったものだ。
デモでは、飲料の在庫データに問題が見つかって、報告会までに時間がない中で原因を突き止めるという状況を想定。対話形式で、期間を指定して「商品ごとの在庫の推移を教えて」と指示すると、クエリーのSQLが生成されて、クエリー結果がグラフで表示された。
さらに、グラフで落ち込んでいる部分について、その期間を指定して「ビールの発注日、発注量の合計、仕入れ先を教えて」と指示してSQLを生成しグラフを確認、さらに仕入れ先を指定して「各商品の合計発注量を教えて」と指示してSQLを生成しグラフを確認すると、ビールの発注量が非常に少なかったことがわかった。
IDEで生成AIによりコード生成
生成AIによるコード生成としては、コーディング用のDuet AIも、「Duet AIとCloud Workstationsで次世代の開発体験」のコーナーでデモされていた。
これは、IDEから自然言語の対話形式で「コードを説明して」「アプリが起動しません」と質問したり、コードの中に書いたコメントからコードを生成して補完したりできるもの。ありていに言ってしまうと、「GitHub Copilot」や「GitHub Copilot」のようなものだ。
ブースでは、Googleによるクラウド上のIDE「Cloud Workstation」でデモしていた。そのほかのIDEとしては、VS CodeやJetBrains IDEに対応している。
セキュリティ可視化も生成AIが支援
Google Cloud利用者が自分のワークロードを守るセキュリティ機能についても、生成AIを使った機能を含めて、「企業のセキュリティ体制と保護を実現するSecurity Foundation」のコーナーでデモされていた。
対象となるのは、Google Cloud上の自分のリソースについて、設定の問題やソフトの脆弱性、脅威、コンプライアンス適合状態などを集約して可視化する「Security Command Center Premium」だ。
デモでは、自分のリソースに含まれる脆弱性についてリソースタイプ別にグラフ化したり、未対応の脆弱性をリストアップしたりといったところを見せた。
さらに、検索された脆弱性の情報について、説明文や影響を受けるリソースなどの内容から、Duet AIによってサマリーを作るプレビュー版機能をデモしていた。