Twitter、おすすめアルゴリズムのソースコードを公開
タレコミ by headless
headless 曰く、
Twitter は 3 月 31 日、イーロン・マスク氏の予告通りおすすめツイートアルゴリズムのソースコードを公開するとともに、アルゴリズムを解説するブログ記事を公開した (Twitter のブログ記事、 Ars Technica の記事、 The Verge の記事、 GitHub リポジトリ)。
Twitter のおすすめアルゴリズムは 5 億件のツイートから各ユーザーに合わせた数件のツイートを抽出する必要がある。そのため、1) 候補ソースを用いてベストなツイート 1,500 件を抽出し、2) 機械学習モデルでランク付け、3) ユーザーがブロックしたツイートや既読のツイート、NSFW コンテンツなどを排除して最適なものを選び出す、といった流れで処理を行うという。候補ソースはユーザーがフォローしている人々のツイート (ネットワーク内) とフォローしていない人々のツイート (ネットワーク外) に分かれ、現在はほぼ半々でタイムラインに表示されるようになっているとのこと。
ソースコードは GitHub で公開されており、ライセンスは AGPL となっている。
Twitter、おすすめアルゴリズムのソースコードを公開 More ログイン