Infostand海外ITトピックス
オープンソースではなく「オープンモデル」 Googleの新言語モデル「Gemma」
2024年3月4日 11:23
「オープンソース」のLlama-2と「オープンモデル」のGemma
AI開発ではクローズドとオープンの2つのアプローチが議論となっている。
OpenAIのGPTシリーズは、LLMの威力を見せつけて世界を圧倒したが、GPT-3以降のモデルを完全にクローズドにしてしまった。その利用はChatGPTかAPI経由に限られ、どのような訓練をされたか、どういうチューニングをされたのかはブラックボックスの中だ。
そこでオープンソース勢の人気を得たのがLlaMA-2だ。Metaは2023年7月にLlaMA-2をオープンソースとして公開した。誰でも、訓練データから「重み」まで入手して、手元のPCで動作させることができることなどから、“オープンソースLLMの筆頭”となった。
AIの基盤であるLLMのふるまいには、なお多くの不明な点がある。改善には多くの研究者の協力と情報共有が必要だ。LlaMA-2によって、こうした謎を解き明かし、AIの透明性を確立するための取り組みが期待できる。
そこへ、Transformers、BERT、TensorFlowなどを開発・公開して、オープンソースを推進したきたGoogleが提供するのだから、頼もしく見える。
しかし、Gemmaは「オープンソース」ではない。
Googleは、同社のオープンソースブログの中で、Gemmaのモデルは「業界が“オープンモデル”と呼び始めているものとしてリリースされている」と説明。オープンソースとは違うとしている。
つまり「モデルの重みに自由にアクセスできるが、使用、再配布、およびバリエーションの所有に関する条件は、オープンソースライセンスに基づかない可能性のある、モデル固有の使用条件」に従うという。「既存のオープンソースの概念は、必ずしもAIシステムに直接適用できるわけではない」と判断したものだ。
Googleの広報担当者もForbesに対し「オープンモデルでは、重みと訓練済みパラメータを利用できる。しかし、実際のソースコードや訓練データにはアクセスできない」と答えている。メディアによっては、「オープンウェイト」とも呼んでいる。