Infostand海外ITトピックス

Metaが「Llama 2」公開、Microsoftは優先パートナーに

Llama 2の“オープン”への疑問

 MetaはLlama 2に「Llama 2 Community License」という独自のライセンスを採用しているが、その「オープン性」に疑問の声も出ている。

 オープンソースに詳しいジャーナリストSteven J. Vaughan-Nichols氏は、The Registerへの寄稿で、Metaの主張する「研究・商利用が可能なオープンソースの次世代LLM」という説明に否定的な見解を示している。

 Llama 2 Community Licenseが、Open Source Initiative(OSI)の認めるオープンソースライセンスではない点。「月間アクティブユーザー数が7億人を超える場合、別途Metaのライセンスが必要」という追加条件。他の言語モデルの学習への使用を禁止していること、などがその理由だ。

 OSIの執行ディレクター、Stefano Maffulli氏は「表面上は、Llama 2のライセンスでは、Amazon、Google、Microsoft、ByteDance、Alibaba、あるいはスタートアップでも成長したら使うことができない。合理的に聞こえるが、『世界の飢餓を解決するようなツールを作るためにはわれわれの許可が必要』と言っているようなものだ」とVaughan-Nichols氏にコメントしている。

 疑問はライセンスについてだけではない。Business Insiderは、MetaがLlama 2の訓練に使用したデータを開示しなかったことを指摘する。

 2月に公開された初代Llamaで全訓練データが開示され、研究者が検証できるようになっていたのとは対照的だ。Llama 2の論文では「公開されているオンラインデータを新しく組み合わせた」としか説明されていない。「これはAI業界では珍しいことだ」(Business Insider)という。

 この点について、Lamini AIのCEO、Sharon Zhou氏は、Metaが開示しない理由として3つの可能性をBusiness Insiderに解説している。

 すなわち、(1)法的な影響の回避、(2)他者にLlama 2を複製させないため、(3)単にリスト作成に時間がかかっている、というものだ。

 LLMの訓練データをめぐっては、著作権、プライバシーの侵害などで訴訟も起こっており、以前よりも厳しい目が向けられている。法的な問題を警戒しているということもおおいにありそうだ。

 当のMetaは、Business Insiderに対し、「競争上の理由から意図的に非公開にしている」と回答している。