Metaは、新しいAIバーチャル・アシスタントの訓練に、同社のソーシャルネットワーキングサービスであるFacebookとInstagramの公開投稿を使用したと発表した。同社は、ユーザーのプライベートな投稿や友人や家族と共有したメッセージは学習データの一部には含まれないと強調している。
先週開催されたMeta ConnectカンファレンスでReutersのインタビューに応じた同社のグローバル担当社長Nick Clegg氏は、「個人情報が圧倒的に多いデータセットは除外するようにした」と述べた。Metaがトレーニングに使用するデータの “大部分”は一般公開されているものだと付け加えた。
Metaは先週水曜日、WhatsApp、Messenger、Instagramで利用可能で、Ray-Ban MetaスマートグラスとQuest 3に搭載される高度な会話アシスタント、Meta AIのベータ版を導入すると発表した。
Meta AIは、7月にリリースされたLLaMA 2言語モデルと、FacebookやInstagramの公開投稿で学習されたEmuテキスト画像モデルによって駆動される。
Clegg氏によると、LinkedInは、プライバシーの問題からMetaが意図的にデータ学習に使用しなかったウェブサイトの例だという。
生成AIの多くの論争の的となる要素のひとつに、LLMが学習させたコンテンツに関する著作権の問題がある。アーティストは今年、Stable DiffusionとMidjourneyに対して著作権訴訟を起こし、作家はOpenAIを訴えた。Clegg氏は、”創造的なコンテンツが既存のフェアユースの教義によってカバーされるか否か”という問題をめぐり、”かなりの量の訴訟”が予想されると述べた。
AIを訓練するためにユーザーコンテンツを利用しているのはMetaだけではない。Elon Musk氏のxAIはユーザーのツイートで学習しているし、Googleは7月のポリシー更新で、投稿されたすべてのユーザーコンテンツをAI学習に使用することを確認した。
Source
コメントを残す