Infostand海外ITトピックス

「Pathways」とは Googleが期待する次世代AI

 Googleが「次世代のAIアーキテクチャ」と呼ぶ「Pathways」を発表した。「1つのモデルを、何千、何百万ものことをこなすよう訓練できる」といい、ゼロからトレーニングする既存のAIモデルに比べ、少ないデータで、短時間で訓練できるという。さらに省エネでもある。汎用AIの実現を期待させるものだ。

数百万のマルチタスクをこなすマルチモーダル

 「既存システムの弱点の多くを解決し、その強みを統合した、新しいAIの考え方」。Google Researchのシニアバイスプレジデント、Jeff Dean氏は、10月28日付の公式ブログでこうPathwaysを紹介している。

 その特徴は、まず「数百万のタスクを総合(generalize)できるモデル」。つまり1つのAIモデルが多くの異なるタスクを処理し、既存のスキルを利用しながら、新しいタスクを、より速く、より効果的に学習できることだという。

 Dean氏は、異なるタスクまで習得する例として、「航空写真から標高を予測するよう学習したモデルで、洪水の際の水の流れ方を予測する」といったことを挙げている。

 また、従来のAIモデルは、一つのこと(画像処理、音声処理、自然言語処理など)を行い、ゼロからトレーニングが必要だが、Pathwaysでは、一つのモデルを訓練して、種類の異なる複数のタスクをこなせるようになるという。

 そのデータ理解も、従来の「モノモーダル」から「視覚、聴覚、言語などを同時に理解するマルチモーダル」に変わる。例えば、「豹(ヒョウ)」を認識する場合、ヒョウという音声言語でも、ヒョウの画像を見せても、Pathwaysモデルの中ではヒョウという概念が活性化される。

 この仕組みは、人間が複数の感覚(入力)を使って世界を認識するのに似ている。Pathwaysは、複数のモードで対象物を捉えることで、しばしばAIが犯す“人間ではありえない非常識な間違い”を回避する、ミスの少ないモデルになるという。