Infostand海外ITトピックス

GitHub Copilotに集団訴訟 AI訓練データで初

 AIの命である訓練データの利用に異議の声が上がった。GitHubが6月に一般提供を開始したAIベースのプログラム支援サービス「Copilot」が開発者の権利を侵害しているとして、オープンソースの開発者と法律事務所が、GitHubと親会社のMicrosoft、開発したOpenAIの3社を訴えるクラスアクション(集団代表訴訟)を提起した。AIモデルの学習と出力を争う米国初の訴訟になるという。

訓練データでライセンス違反

 Copilotは、OpenAIのAIシステムCodexをベースとするプログラミング支援サービスだ。プログラマーがコードを書くのに合わせて、目的にあったコードをスニペットから提案する。月額10ドルのサブスクリプションで、学生や、人気のあるオープンソースプロジェクトの中核開発者は無料で使える。

 訴えたのは、ニューヨーク在住のソフトウェア開発者で弁護士のMatthew Butterick氏と、サンフランシスコの法律事務所Joseph Saveri Law Firmだ。北カリフォルニア連邦地裁に11月3日に提出した訴状によると、3社はGitHubの公開リポジトリのプログラムコードでCopilotのAIシステムを学習させ、コードを掲載したプログラマーの権利を侵害したと主張している。

 GitHubは訓練データの個々の詳細は公表していないが、GitHubリポジトリなどを含む公開されたコードで学習していると説明してきた。これらの多くはMIT License、GPL、Apache Licenseなどの一般的なオープンソースライセンスで提供されているものだ。それぞれのライセンスに従って作者名と著作権帰属の表示が必要で、利用や改変の際にも引き継いで明示する義務がある。

 ところが、Copilotの出力には、それらが表示されておらず、このことがライセンス違反にあたるというのだ。

 さらに、原告側は、GitHub自身の利用規約とプライバシーポリシー、著作権管理情報の除去・改変を禁じたDMCA(デジタルミレニアム著作権)法1202条、CCPA(カリフォルニア州消費者プライバシー法)などに違反していると主張。Copilotの差し止めと損害賠償を求め、損害額は90億ドルを超えると試算している。

 Butterick氏が専用サイトに掲載した声明は、こう述べている。「これは、長い旅路の第一歩だ。われわれが知る限り、これはAIシステムの訓練と出力に異議を唱える米国初のクラスアクションだ。これが最後になることはないだろう」