あなたの好奇心を刺激する、テックと科学の総合ニュースサイト

Twitter、推薦アルゴリズムと機械学習モデルの一部をGitHubに公開

Twitterは金曜日、プラットフォームがユーザーの“For Youタイムライン”の内容を選択するために使用する推薦アルゴリズムの背後にあるコードをオープンソース化することを発表した。

しかし、本日公開されたコードには、広告の推薦を支える部分や、脅威となるアクターがプラットフォームを操作しようとする試みを制御下に置くためのTwitterの能力を危険にさらすようなものは含まれていない。

「今回のリリースでは、可能な限り高い透明性を目指すとともに、ユーザーの安全やプライバシー、あるいは児童の性的搾取や操作に対抗する当社の取り組みを損なうなど、当社のプラットフォームを悪質な行為者から保護する機能を損なうようなコードは除外しました」と、同社は述べている。

「本日のリリースには、私たちの広告推薦の原動力となるコードも含まれていません。また、Twitterアルゴリズムに関連するトレーニングデータやモデルの重みを現時点では公開しないことを決定するなど、ユーザーの安全性とプライバシーが守られるよう、さらなる対策を講じました」

Twitterは、推薦アルゴリズムとそれを支える機械学習(ML)モデルの一部のソースコードを含む2つの別々のGitHubリポジトリを公開した。

同社のエンジニアリングチームが明らかにしたように、For Youのタイムラインに並ぶツイートは、以下のパイプラインを使用するHome Mixerと呼ばれるサービスによって選ばれる:

  1. 候補ソーシングと呼ばれるプロセスで、異なるレコメンデーションソースから最適なツイートを取得する。
  2. 機械学習モデルを使用して、各ツイートをランク付けする。
  3. ブロックしたユーザーのツイート、NSFWコンテンツ、すでに見たツイートなどを除外するなどのヒューリスティックとフィルタを適用する。

「各リクエストに対して、これらのソースを通じて数億のプールからベストな1500ツイートを抽出することを試みます」とTwitterは説明している。

「あなたがフォローしている人(In-Network)とフォローしていない人(Out-of-Network)から候補者を探します」

最終的な目標は、各ユーザーのFor Youのタイムラインに、フォロワーからの関連性のある最新のツイートが50%、残りの50%は、ユーザーが興味深いと思うものに基づいて、ネットワーク外の人からのツイートが表示されるようにすることだ。

ネット上に流出したTwitterのソースコード

今月初め、TwitterはGitHubに流出し、少なくとも数ヶ月間公開されていた独自のソースコードと内部ツールを取り下げた。

また、DMCA侵害の通知において、同社はGitHubに対して、流出したコードのアクセス履歴の情報を提供するよう求めており、コードがオンラインで公開されている間に誰がダウンロードしたかを知ることが出来るとのことだ。

Twitterはまた、カリフォルニア州北部地区連邦地方裁判所に提出した召喚状を用いて、ファイルを最初に公開したFreeSpeechEnthusiasmユーザーと、流出したTwitterソースコードにアクセスして配布した人物の識別情報をGitHubに共有させようとしており、この情報もおそらくさらなる法的措置に利用される可能性があるとのことだ。

本日の発表は、TwitterのCEOであるElon Musk氏がTwitterのアルゴリズムを公開することを約束するツイートを行ったことを受けてのものだ。


Source

Follow Me !

この記事が気に入ったら是非フォローを!

Share!!

スポンサーリンク

おすすめ記事

執筆者
Photo of author

masapoco

TEXAL管理人。中学生の時にWindows95を使っていたくらいの年齢。大学では物理を専攻していたこともあり、物理・宇宙関係の話題が得意だが、テクノロジー関係の話題も大好き。最近は半導体関連に特に興味あり。アニメ・ゲーム・文学も好き。最近の推しは、アニメ『サマータイムレンダ』

記事一覧を見る

コメントする

CAPTCHA