OpenAI、ChatGPT著作権訴訟で全面対決、著作権侵害の主張には「欠陥がある」

昨年に爆発的な成長を見せたStable Diffusion等の画像生成AIや、ChatGPT等のテキスト生成AIに関し、機械学習モデルを作成するための学習データをめぐる訴訟が後を絶たない。

ChatGPTとその基礎となる大規模言語モデル「GPT」を開発したOpenAI社は、AIの出力が著作権を侵害していると主張する著作者から起こされた訴訟において、同社に対する請求の大半を棄却する方向で動いている。

著作権違反の主張は“技術の誤解に基づく”とOpenAI

GPT-4のようなChatGPTを支える機械学習モデルは、インターネットからかき集めた膨大な量のデータで学習される。OpenAIはGPT-4の学習データに関する情報を公開していないが、以前のGPT-3モデルの学習データには「インターネットベースの書籍コーパス」、つまりオンラインで入手可能な書籍のデータベースが含まれていたことを認めている。

Sarah Silverman、Christopher Golden、Richard Kadreyの3名と、Paul Tremblay、Mona Awadの2名は、ChatGPTが出力するすべてのデータが自分たちの書籍の二次的著作物であり、著作権を侵害していると主張している。彼らの主張は以下の点に及ぶ：

直接的な著作権侵害
副次的著作権侵害
著作権管理情報の削除（DMCA）
不正競争
不当利得
および過失。

著作者がOpenAIを提訴しているのは、彼らの著作物が彼らの同意なしにGPTモデルのトレーニング教材の一部となっているためである。

OpenAIは、カリフォルニア州の裁判所に、両訴訟の大半の請求を棄却する同一の申し立てを提出した。同社によれば、著者らの請求は「欠陥」があり、1件を除いてすべて棄却されるべきものだという。OpenAIが棄却を申し立てた請求には、副次的著作権侵害、デジタル・ミレニアム著作権法違反、不正競争、過失、不当利得が含まれる。この申し立てが認められれば、裁判の中心は直接の著作権侵害という1つの申し立てになる。

OpenAIの申し立てでは、「このような主張は当初から訴訟から切り捨てることが重要である。そうすれば、このような訴訟は法的根拠の乏しい責任論でディスカバリー（証拠開示）以降に進むことはない」と、述べられている。“ディスカバリー（証拠開示）”とは、訴訟に関連する文書や社内プロセスに関する詳細があれば、当事者に開示を強制する法的プロセスである。

同社が棄却を申請した理由は様々であるが、一般的には、著作者の主張が技術を誤解しており、過大であるとするものである。却下申し立ての中でOpenAIは、著作権が技術革新を妨げるべきではないというフェアユースと、学習データから著作権のある特定の文章を直接取り込むことなく、実質的に新しいコンテンツを生成する大規模言語モデルの仕組みを挙げている。

OpenAIは、GPTモデルはテキストを生成するために「統計的相関関係の驚異的に大きなシリーズ」を使用し、「単語の頻度、構文パターン、テーママーカー」を含むそのような統計的情報は著作権で保護されないと主張している。したがって、GPTの出力が著者の著作権を侵害しているという主張は破棄されるべきであり、つまり、代理的著作権侵害の主張であるとOpenAIは主張している。直接的な著作権侵害については、著作者は具体的な主張をしておらず、著作権を侵害しない新たな製品を作成するために作品のホールセールコピーを作成することはフェアユースであるとOpenAIは主張する。

OpenAIは、革新的かつ変形的な方法での著作物の使用が著作権を侵害しないと判断されたいくつかの事例を挙げている。著者の名前など著作権に関連する情報が削除されているという主張は、単に虚偽であり、根拠がないと彼らは言う。

OpenAIは判決に明確さを求める

OpenAIは、ChatGPTのすべてのアウトプットが個々の著作者の作品に「基づいている」というのは、「遠隔的かつ口語的な意味においてのみ」であり、すべてのアウトプットが著作権で保護された作品に似ていないとしても、すべてのアウトプットが全員の著作権を侵害していると考えるのは「軽薄」であり、「著作権法がどのように機能するかではない」と主張している。

著作権の専門家Andres GuadamuzがTwitterで指摘しているように、このような主張にもかかわらず、OpenAIは最初の主張である直接的な著作権侵害の主張を棄却することを明確に求めていない。

Finally read the motion to dismiss from OpenAI in the Sarah Silverman case. Interestingly, the defendants are not asking to dismiss all claims! https://t.co/jK2VGAFS09
— Andres Guadamuz (@technollama) August 30, 2023

Guadamuz氏はこの動きを「意外だ」としながらも、戦術的なものであることを示唆している：OpenAIは、AIトレーニングがフェアユースに該当するという判決を望んでいるのかもしれない。

Guadamuz氏は、著作権侵害の直接請求が実際に裁判になった場合、「それは大きなことだ」と言う。Guadamuz氏は、OpenAIの要求通り、他の容疑が棄却される可能性は十分にあると見ている。

そうなれば、直接的な著作権侵害が裁判の焦点となる。Guadamuz氏はまた、OpenAI社はこの裁判に勝てる可能性が高いと考えているかもしれないとし、「この2、3ヵ月に私が話をした多くの著作権弁護士は、そう考えているようだ」と述べている。

Sources

Tremblay and Awad case
via TorrentFreak: OpenAI Asks Court to Dismiss Authors’ Copyright Infringement Claims