OpenAIとMicrosoftは、ChatGPTを訓練するためにインターネットユーザーから同意なしに「膨大な個人情報」を盗んだとして、30億ドルの損害賠償を求める集団訴訟を起こされている。
この訴訟は6月28日にカリフォルニア州サンフランシスコの連邦裁判所に提起されたもので、16人の匿名の原告を含み、OpenAIがデータブローカーとして登録することも同意を得ることもなく、密かに「インターネットから3000億語をかき集めた」と主張している。MicrosoftはOpenAIの主要顧客であり、企業パートナーであり、同社のAI技術を数十億ドルでライセンスしている。
原告側はまた、AIモデルに入力される情報をプロンプトと呼び、「製品の開発とトレーニングを継続するために、世界中の何百万人もの無防備な消費者から個人データを違法に収集し、追加で入力している」と主張している。
昨年11月、OpenAIとMicrosoft、GitHubに対し、AIを搭載したCopilotを構築するためにライセンスコードをスクレイピングしたとして集団訴訟が起こされた。これは彼らにとって最悪の悪夢となり、さらに大きくなり続けている。彼らは今、集団訴訟の訴状案の却下を裁判所に求めている。
今回の訴訟では、言語モデルGPT 3.5と4.0、画像モデルDall-E、音声合成モデルVall-Eなど、OpenAIによって開発され、Microsoftによって使用されている一般的なAIツールが挙げられている。同訴訟では、原告らの長年にわたるインターネット上での行動を列挙し、「このような形で(AIを訓練するために)第三者が(自分の)個人情報を使用することに同意していない」とし、企業が “製品を訓練するために、この広範なオンライン・アプリケーションとプラットフォーム全体から個人データを盗んだ”と述べている。
OpenAIが盗んだと主張するデータには、氏名、連絡先、メールアドレス、支払い情報、ソーシャルメディア情報、チャットログデータ、利用データ、分析、クッキーなどが含まれる。
「ChatGPTを含む10億ドル規模のAIビジネスは、インターネットユーザーの個人情報を収集し、収益化することで成り立っているため、被告は個人情報の窃盗によって不当に利益を得ている。したがって、原告および集団は、窃盗されたデータの価値および/または被告がそこで得た利益の取り分に相当する遺棄および/または返還の損害賠償を請求する権利を有する」と、原告側は述べている。
訴訟では、OpenAIとMicrosoftに対し、人々のプライバシーを侵害することを差し止めること、そしてさらなる措置を講じることを求めている。ステップ1は、どのようなデータが収集され、それがどのように使用されているかを開示すること。ステップ2は、倫理原則の規範に従い、盗まれたデータを補償することだと原告側は書いている。最後に、インターネット利用者はいかなるデータ収集からもオプトアウトする権利を持つべきであり、データの違法な持ち出しはすべてやめるべきだと訴えた。
この新たな訴訟は、OpenAIがそのトレーニング方法やデータセットに関する秘密主義や、著作権侵害の可能性について繰り返し精査されてきた後に起こったものだ。GPT-4が3月にリリースされたとき、多くのAI研究者たちは、このような情報の非公開がより大きな害をもたらし、外部の科学者たちがシステムの欠陥や偏りを根絶する機会を閉ざしてしまうという事実を声高に訴えた。
この訴訟では、「早急な法的介入」なしにはAIが「存続の危機」にさらされる可能性についても言及している。同訴訟は、AIシステムの普及を一時停止するか規制するよう求める著名人からの最近の呼びかけにも言及している。例えば、イーロン・マスクを含む専門家や技術界のリーダーが署名したAIのトレーニングの一時停止を求める公開書簡や、ChatGPTが欧州のデータ保護法に違反しているとの懸念から、イタリアが同国でのChatGPTの一時禁止を決定したことなどが挙げられる。OpenAIがプライバシー管理を追加した後、サービスは再開された。
「被告の製品を含むAIの普及は、我々の法律と社会的モラルの合理的なガードレールによって抑制されなければ、存続的な脅威をもたらす。被告のビジネスとスクレイピングのやり方は、根本的に重要な法的・倫理的問題を提起しており、それにも対処しなければならない。法律を施行することは、AIのイノベーションを抑制することにはならず、むしろすべての人にとって安全で公正なAIの未来を実現することになる」と訴訟では述べている。
Sources
コメントを残す