インタビュー

Google DeepMindが進める「大胆かつ責任あるAI」の取り組みとは?

 Google Cloudが、8月1日~2日に開催した日本での年次イベント「Google Cloud Next Tokyo '24」の基調講演では、Alphabet傘下でAIを開発するGoogle DeepMind社のセシュ・アジャラプ氏(プロダクト&エンジニアリング シニア ディレクター)が登壇した。

 Google DeepMindは、囲碁AI「AlphaGo」などの実績を持つDeepMind社が、2023年にGoogle Brainと統合してできた会社だ。現在はLLMの「Gemini」などを開発している。

 講演でアジャラブ氏は、DeepMindの歩みを紹介し、Geminiの能力を紹介するとともに、「人類にとって利益のあるAIを責任ある形でつくりあげる(Build AI responsibly to benefit humanity)」というGoogle Deepmindのミッションを語っていた。

 こうしたGoogle DeepMindおよびGoogle CloudのAIへの取り組みについて、「Google Cloud Next Tokyo '24」会場でアジャラブ氏に話を聞いた。また、Google CloudでAIモデルを使ってAIを開発するVertex AIなどについて、Google Cloud 統括技術本部長(アナリティクス / ML、データベース)の寳野雄太氏が補足した。

Google DeepMind社のセシュ・アジャラプ氏(プロダクト&エンジニアリング シニア ディレクター、左)と、Google Cloudの寳野雄太氏(統括技術本部長(アナリティクス / ML、データベース)、右)
「Google Cloud Next Tokyo '24」基調講演でのGoogle DeepMind社のセシュ・アジャラプ氏

世に早く影響を与えつつ優れたケアを目指す「大胆かつ責任あるAI」

――Google DeepMindおよびご自身の、GoogleのAI事業の中における位置づけを教えてください。

アジャラブ氏: Google DeepMindは世界をリードするAIの研究所です。イギリスにルーツを持ち国際的なメンバーが集まった組織です。

 Google DeepMindには大きく分けて3つのチームからなります。生成AIなどの基礎研究の「リサーチチーム」、研究をもとに科学的な問題を扱う「サイエンスチーム」、研究結果をGoogleの製品に応用する「アプライド(応用)チーム」です。私はそのアプライドチームを率いています。

 Google DeepMindの使命は、AIを責任ある形で広めること、科学的なブレークスルーや革新的な研究結果を広めること、何十億もの人の人生に利益をもたらすためにGoogle製品にAIを応用することです。

google DeepMind社のセシュ・アジャラプ氏(プロダクト&エンジニアリング シニア ディレクター)

――最近では世の中で「責任あるAI」が議論されています。基調講演でも「大胆かつ責任あるAI」という言葉が使われていました。そうした問題について、どのように考えているか教えてください。

アジャラブ氏: われわれは、優れたテクノロジーには優れたケアが必要だと信じています。大胆ではないとなると、多くの人に利益を早くもたらすことができず、影響を与えられないと思っています。わくわく感とともに、緊急性を持って影響をもたらす必要があると考えています。

 一方で、生成AIというパワフルな技術によって、有害なアウトプットや、一部の人しか代表しないバイアスが生まれる可能性があります。われわれとしては、インクルーシブで倫理的で責任ある安全なAIとしてこの技術を活用したいと考えています。

基調講演での「大胆かつ責任あるAI」の言葉

 具体的には3つの領域で検討を行っています。1つめは「責任あるガバナンス」です。Google DeepMindでは、「AI Principle」(AI基本原則)を基本原則として5~6年前に発表しています。この原則にのっとって多くの人にメリットを与え、リスクを抑える方針です。

 2つめは「責任あるリサーチ」です。責任を持って、データのバイアスや、有害な結果がないかどうか、あるいはインクルーシブな研究かどうかを確認して研究します。これについては最近、社会的および倫理的なリスクを評価するフレームワークとして、3層のフレームワークを提案しています。このフレームワークでは、社会的なコンテキストや背景を理解してインパクトを評価すべきだと考えます。

 3つめは「責任あるインパクト」です。これについては、さまざまな組織の専門家の協力をあおいでいます。例えばAlphaFoldであれば生物倫理学者と、グローバルな課題解決についてはOECD(経済協力開発機構)と組むことをしています。その目的は、共通のスタンダードや基準を設定し適切に普及させることです。

 Googleの使命は、「世界の情報を整理し、誰でもアクセスできて使えるようにすること」です。YouTubeで子供が学んだり、Google Mapで道を知ったり、Google Lensで目の見えない方が情報にアクセスしたりと、Google製品を使っていただくうえで責任ある形で技術を提供する必要があると考えています。

Geminiの4種類のモデルとオープンモデルのGemma

――Google Deepmindの開発しているAIモデルのGeminiの特徴をあらためて教えてください。

アジャラブ氏: Geminiとしてはいくつかのモデルがあります。一番大きいのが「Gemini Ultra」で、物理学や数学などの論理的な理解に使います。これは多くのユースケースでは、使う必要があるかというとそうではありません。

 次が「Gemini Pro」です。これは、多くの人にとってたくさんのワークロードに使ってもらえるモデルです。

 最近リリースされたのが、軽量な「Gemini Flash」です。スピードと効率に最適化されており、低遅延やロングコンテキストなどが特徴です。

 一番小さいのが「Gemini Nano」です。オンデバイスやオフラインでの利用を想定したもので、Pixelにも入っています。

 プロプライエタリなモデルであるGeminiのほかに、オープンモデルの「Gemma」があり、パラメータ量で2B、9B、27Bの3種類があります。Geminiはそのままあるいはアダプターチューニングで使うものですが、Gemmaは特定分野向けにフルファインチューニングするのに使えます。

――例えばVertex AIなどでは、Gemini以外のさまざまなモデルが利用できます。その中でGeminiの強みはどのようなところでしょうか。

アジャラブ氏: われわれはお客さまファーストです。自分たちのモデルには自信を持っていますが、お客さまには選択肢を提供します。

寳野氏: Vertex AIでは、モデルだけではなく、すべてのレイヤーで柔軟性を提供しています。モデルでは例えばAnthropicのClaudeなどさまざまな選択肢があります。

 モデル以外では、例えば、Vertex AI Searchでは検索やRAG、要約などの能力を持っていますが、そのうちグラウンディング部分だけを使いたいとか、生成物が正しいかどうかをチェックするCheck grounding APIを使いたいといったコンポーネント単位で選択肢を提供して、AIの実用化を加速しようとしています。

Google Cloudの寳野雄太氏(統括技術本部長(アナリティクス / ML、データベース))

――そのGoogleのAI開発ツールであるVertex AIの強みを教えてください。

寳野氏: 基調講演でも紹介したように、Vertex AIは、Model Garden、Model Builder、Agent Builderの3レイヤーを提供している点が重要です。

 Model Gardenでは新しいモデルでも使った分だけの課金で使える選択肢の広さが1つの特徴です。

 またModel Builderでは、ファインチューニングや、特定のタスクについて大きなモデルと同じ性能のより小さいモデルを実現するディスティレーション、RHLF(人間のフィードバックによる強化学習)などを提供します。

 Agent Builderにはさまざまな機能がありますが、エージェントのアクションとして大きいのが検索機能で、そこにGoogleの検索技術が生きています。

Vertex AIの3要素(基調講演より)

マルチモーダル生成AI搭載ロボットも研究

――生成AIのアプリケーションとしては、今、対話型AIや、Google Workspaceへの組み込みなどが使われています。その中でのGoogleの長所や、新しいアプリケーションの可能性などについて教えてください。

アジャラブ氏: Geminiのマルチモーダルの例としては、YouTubeとの連携による自動チャプター生成やYouTubeショートの発見、あるいは視覚障害のある人を支援するGoogle Lookoutなどで、すでに使われています。

 今後の応用例としては、小規模な広告主向けのカスタマーサポートエクスペリエンスなどにも取り組んでいます。

寳野氏: いま話のあったような分野でGeminiを試して、いきなり製品を出すのではなく、試して鍛えていってエンタープライズで利用可能になったタイミングで出す、というのは1つの強みかと思います。

――新しい分野としては、Google DeepMindではマルチモーダルAI搭載ロボットを開発して、サッカーをプレイするところを披露したというニュースも目にしました(注:その後卓球をプレイするロボットも披露された)。

アジャラブ氏: 生成AIが著しく進歩し、ロボットに応用できるエキサイティングな転換点に来ていると考えています。これは、RT-2(Robotic Transformer 2)というVLM(Vision Language Model)の研究にもとづいたもので、周辺にある環境を完全に理解してそこからアクションを起こすことができます。

 こうしたロボットをコントロールされた環境で実験する題材ということで、サッカーから始めました。われわれの目標としては、ロボットを皿洗いのような日常で使ってもらって人間を助けるものを目指しています。

生成AIでサッカーするロボット(Google DeepMindのX投稿より)

――最後に、言っておきたいメッセージがあればお願いします。

アジャラブ氏: 生成AIはまだ初期の段階にあります。生成AIのためにパートナー企業を探すなら、イノベーションのカルチャーがある企業であること、エンタープライズファーストの企業であること、大きなチャレンジを解決できる能力がある企業、基礎研究に力を入れている企業でなければいけないと思っています。

 もう1つ、パートナー企業のあるべき姿としては、自社の製品にテクノロジーを取り入れて、そのリスクの軽減に力を入れている企業こそがふさわしいと思っています。

寳野氏: セシュ(アジャラブ氏)からはAIの進化をふまえたの話がありましたが、私はもう少し短期的なところで。Vertex AIを使うと、商用レベルまでもっていく時間を短くできます。

 例えば基調講演に登壇いただいた日本テレビでは、コンテクスチュアル広告にGeminiとVertex AIをすでに導入しています。この事例は、私のチームがサポートして、2~3か月で実現までもっていきました。

 生成AIは、まだまだやってみないとわからないことが多くて、ビジネスに価値をもたらすという仮説にいっしょに取り組めるところがあるといいかと思います。Google Cloudは、Vertex AIのようなプラットフォームや、アクセラレーションプログラムのTAPなどを持ち、お客さまといっしょにロードマップを考えられるのが強みだと思います。