Infostand海外ITトピックス

GitHub Copilotに集団訴訟 AI訓練データで初

フェアユースは認められるのか?

 40年以上オープンソース運動にかかわってきたという原告のButterick氏は、開発者の立場からこれを、オープンソースの根本を揺るがす問題だと言う。

 提訴後のThe Vergeのインタビューで同氏は「開発者はライセンスを信じてコードを公開しているのに、企業が尊重しないのならライセンスの意味がなくなる」と言い、「ライセンス表記なしでコードを利用させると、オープンソース運動そのものを殺してしまう」と語っている。また、コードに作者を明記することで仕事の獲得につなげている開発者の生活の道を奪うことになるとも述べている。

 この訴訟では、コードの使用がフェアユースに該当するかが大きなポイントになるという。過去の例では2005年、図書館の蔵書をスキャン・電子化して登録する「Google Books」プロジェクトが著作権侵害にあたるとして作家団体Authors Guildと3人の著者がGoogleを訴えたクラスアクションがあった。

 Google Books訴訟は10年かけて争われ、2015年10月、連邦控訴裁がフェアユースを認め、Google側勝訴の二審判決を下している。作家側は上訴したが、却下された。

 AIの世界の現状から言うと、訓練用のデータの多くはスクレイピング(Webをクロールしての抽出)で収集されている。これを行っている企業は、著作権で保護されているデータの場合も米国の場合はフェアユースが認められると主張している。

 しかし、The Vergeは「法律の専門家によると、これは定説とはほど遠く、Butterick氏のクラスアクションのような訴訟が、微妙に定義された現状を覆す可能性がある」と伝えている。見方は分かれるようだ。

 企業法務サイトLexologyは、この訴訟にはフェアユースのほかに、以下のような論点があると解説している。

  • GitHubからコードがコピーされたのか
  • Copilotの出力はGitHubのコードの派生物か
  • オープンソースのライセンス条項がコードの利用を制限するか

 クラスアクションは「共通の利害を持つ一定範囲の関係者」(クラス)を代表して、ひとりまたは数名が訴えるものだ。判決の効力はクラス全体に及ぶ。ただし、訴訟が始まるには、まず裁判所のクラス認定を受ける必要があり、この訴訟が成立するかは、現時点でまだ確定していない。