あなたの好奇心を刺激する、テックと科学の総合ニュースサイト

OpenAIのGPTBot、大手サイトや出版社によって早速ブロックされる

OpenAIは、AIモデルの改良のためにWeb上のコンテンツを収集する目的でクローラー「GPTBot」を運用しているが、パブリッシャーやWebサイト運営者が、自分たちのコンテンツをチャットボットやAIモデルに無料で提供したくない場合、オプトアウトする手段を提供している。これは、robots.txtファイルを介してGPTBotを明示的にブロックすることによって行うことができる。

この動き自体は今月の初めに導入されたが、New York Times、CNN、Reuters、Chicago Tribune、ABC、Australian Community Media(ACM)などの大手メディア企業は早速OpenAIによってコンテンツが収集されないようにGPTBotをブロックしているようだ。加えて、Amazon、Wikihow、Quoraなどの他のWebベースのコンテンツプロバイダーもOpenAIのクローラーをブロックしている。

Originality.aiの分析によると、8月末時点でトップ1000のWebサイトの9.2%がGPTBotをブロックしており、週ごとの増加率は5%だった。分析した759のrobots.txtファイルのうち、69にGPTBotのブロックが設定されていた。上位100サイトのうちのブロック率は15%だという。

82ca301b270b72953c6104df46254d00
Webサイトは8月初めからGPTBotをブロックできるようになり、トップ1000のWebサイトの10%弱がこのオプションを利用している。 (Credit: Originality.ai)

ドイツ最大のニュースポータルBild.de、t-online.de、n-tv.deやSpiegel Onlineは、まだGPTBotをブロックしていないようだ。sueddeutsche.de、zeit.de、welt.deなどの他のオンラインニュースポータルは、robots.txtを修正してGPTBotを除外しているようだ。ドイツの公共放送局SWRもGPTBotをブロックしている。

チャットボット対コンテンツ提供者

GPTBotをブロックすることは、コンテンツ提供者にとっては適切な動きだろう。OpenAIのWebブラウジング機能のようなChatGPTプラグインは、ChatGPTによるWebページへのアクセスを可能にし、Webページのコンテンツをチャットに取り込み、それを元にチャットボットとやりとりすることを可能にする。

これはユーザーがWebサイトに訪問することなく情報を入手することを可能にするため、その結果マネタイズ、つまりWebサイト運営者にとっては直接的な損失となる。たとえコンテンツが長期保存されAIのトレーニングに使用されなくてもだ。したがって、ほとんどの場合、GPTBotをブロックする人は、ChatGPTユーザーエージェントをブロックすることにも関心があるはずだ。

特に、ChatGPTが有料コンテンツにも不適切にアクセス出来てしまう問題から、そのWebブラウジング機能を一時停止したことでこの問題は大きく取り上げられた。

ただし、Microsoftは引き続きBing Chatを提供しており、チャットウィンドウに表示されるWebサイトのコンテンツは若干改編されている。現在テスト中のGoogleのAI検索もWeb上のコンテンツを要約し検索画面に表示するなどの方法を用いている。

すべての法的状況はおそらく法廷で解決されなければならないだろう。それはおそらく、大手出版社とGoogle、Microsoft、OpenAIのような大手AI企業との間で今後数ヶ月の間に起こりうる可能性がある。既に先日、New York Times紙は、OpenAIに対する訴訟を準備していると報じられている


Source

Follow Me !

この記事が気に入ったら是非フォローを!

Share!!

スポンサーリンク

執筆者
Photo of author

masapoco

TEXAL管理人。中学生の時にWindows95を使っていたくらいの年齢。大学では物理を専攻していたこともあり、物理・宇宙関係の話題が得意だが、テクノロジー関係の話題も大好き。最近は半導体関連に特に興味あり。アニメ・ゲーム・文学も好き。最近の推しは、アニメ『サマータイムレンダ』

記事一覧を見る

コメントする

CAPTCHA