Twitter、推薦アルゴリズムと機械学習モデルの一部をGitHubに公開

masapoco
投稿日
2023年4月1日 6:55
twitter icon

Twitterは金曜日、プラットフォームがユーザーの“For Youタイムライン”の内容を選択するために使用する推薦アルゴリズムの背後にあるコードをオープンソース化することを発表した。

しかし、本日公開されたコードには、広告の推薦を支える部分や、脅威となるアクターがプラットフォームを操作しようとする試みを制御下に置くためのTwitterの能力を危険にさらすようなものは含まれていない。

「今回のリリースでは、可能な限り高い透明性を目指すとともに、ユーザーの安全やプライバシー、あるいは児童の性的搾取や操作に対抗する当社の取り組みを損なうなど、当社のプラットフォームを悪質な行為者から保護する機能を損なうようなコードは除外しました」と、同社は述べている。

「本日のリリースには、私たちの広告推薦の原動力となるコードも含まれていません。また、Twitterアルゴリズムに関連するトレーニングデータやモデルの重みを現時点では公開しないことを決定するなど、ユーザーの安全性とプライバシーが守られるよう、さらなる対策を講じました」

Twitterは、推薦アルゴリズムとそれを支える機械学習(ML)モデルの一部のソースコードを含む2つの別々のGitHubリポジトリを公開した。

同社のエンジニアリングチームが明らかにしたように、For Youのタイムラインに並ぶツイートは、以下のパイプラインを使用するHome Mixerと呼ばれるサービスによって選ばれる:

  1. 候補ソーシングと呼ばれるプロセスで、異なるレコメンデーションソースから最適なツイートを取得する。
  2. 機械学習モデルを使用して、各ツイートをランク付けする。
  3. ブロックしたユーザーのツイート、NSFWコンテンツ、すでに見たツイートなどを除外するなどのヒューリスティックとフィルタを適用する。

「各リクエストに対して、これらのソースを通じて数億のプールからベストな1500ツイートを抽出することを試みます」とTwitterは説明している。

「あなたがフォローしている人(In-Network)とフォローしていない人(Out-of-Network)から候補者を探します」

最終的な目標は、各ユーザーのFor Youのタイムラインに、フォロワーからの関連性のある最新のツイートが50%、残りの50%は、ユーザーが興味深いと思うものに基づいて、ネットワーク外の人からのツイートが表示されるようにすることだ。

ネット上に流出したTwitterのソースコード

今月初め、TwitterはGitHubに流出し、少なくとも数ヶ月間公開されていた独自のソースコードと内部ツールを取り下げた。

また、DMCA侵害の通知において、同社はGitHubに対して、流出したコードのアクセス履歴の情報を提供するよう求めており、コードがオンラインで公開されている間に誰がダウンロードしたかを知ることが出来るとのことだ。

Twitterはまた、カリフォルニア州北部地区連邦地方裁判所に提出した召喚状を用いて、ファイルを最初に公開したFreeSpeechEnthusiasmユーザーと、流出したTwitterソースコードにアクセスして配布した人物の識別情報をGitHubに共有させようとしており、この情報もおそらくさらなる法的措置に利用される可能性があるとのことだ。

本日の発表は、TwitterのCEOであるElon Musk氏がTwitterのアルゴリズムを公開することを約束するツイートを行ったことを受けてのものだ。


Source



この記事が面白かったら是非シェアをお願いします!


  • googleai
    次の記事

    Google、AIへの投資を優先させるために、有名な福利厚生サービスの削減などコスト削減を実施へ

    2023年4月1日 10:16
  • 前の記事

    Google、今後数日以内にBardの言語モデルをより大規模なPaLMに移行する事を明らかに

    2023年4月1日 6:34
    google

スポンサーリンク


この記事を書いた人
masapoco

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です


おすすめ記事

  • 866814b0eb13da0fbb4d489b058e5c46

    AIが「内なる独白」を行うようにしたところ、推論パフォーマンスが大幅に向上した

  • gemma header.width 1600.format webp

    Google、GeminiベースのオープンソースAIモデル「Gemma」を発表

  • Google、ファイルの種類を高速に判別するAI「Magika」をオープンソースで公開

  • MGIE Instruction Based Image Editing Examples

    Appleがテキスト入力による画像編集を可能にする「MGIE」モデルをオープンソースで公開

  • Mercedes-Benzが人為的ミスにより驚異的な量の企業秘密やソースコードを全世界に公開してしまう

今読まれている記事