馬斯克兌現承諾!X平臺重磅開源推薦算法,6小時1.6k Star,引領行業透明新風

   時間:2026-01-21 12:51 來源:天脈網作者:沈瑾瑜

近日,科技界迎來一則重磅消息:X平臺掌舵者埃隆·馬斯克宣布,將X平臺最新的內容推薦算法開源。這一決定猶如一顆投入平靜湖面的石子,在社交平臺領域激起層層漣漪,引發了廣泛關注與熱議。

在社交平臺競爭日益激烈的當下,推薦算法一直是各平臺的“核心機密”。用戶刷到的每一條動態、每一個廣告,背后都是算法依據用戶行為、內容標簽、商業訴求等多維度數據計算得出的結果。此前,像Facebook、Instagram等社交平臺,都將算法緊緊鎖在“黑箱”之中,外界只能通過逆向工程來猜測其運行邏輯,平臺也鮮少主動公開相關信息。然而,馬斯克卻反其道而行之,這一舉措無疑打破了行業的常規。

馬斯克之所以做出這樣的決定,并非一時興起。接手X平臺前后,他就多次吐槽“算法不透明”的問題,立志要打造一個“自由廣場”。此次開源算法,是他對X平臺改造的關鍵一步。一方面,通過開源讓全球開發者和用戶能夠監督算法邏輯,減少“算法偏見”“流量操縱”等方面的質疑,同時也能更好地應對監管;另一方面,借助社區的智慧來優化算法。畢竟,全球程序員的智慧遠超內部團隊“閉門造車”,這有助于鞏固X平臺的生態護城河。而且,馬斯克還表示,后續將每四周更新一次代碼,并附帶開發者說明,標注算法和邏輯上的改動內容。這種“持續開源 + 透明更新”的模式,在社交平臺領域堪稱前所未有的嘗試。

很快,X平臺工程團隊的Engineering官方賬號給出了答案,正式宣布開源新的X推薦算法。該算法采用了與xAI的Grok模型相同的Transformer架構。與此同時,相關的GitHub倉庫也一并公開,上線僅六小時就獲得了1.6k個Star,足見其受關注程度之高。

打開GitHub倉庫(https://github.com/xai-org/x-algorithm ),我們可以看到這次開源的是“For You(為你推薦)”信息流的核心推薦系統。據X工程團隊介紹,“For You”信息流的內容主要來自兩大方面。一是站內內容,由Thunder模塊負責,即用戶關注賬號發布的帖子;二是站外內容,由Phoenix召回模塊處理,也就是從全網內容庫中篩選出的帖子。這兩類內容整合后,會交給Phoenix模型進行分析。該模型基于Grok Transformer模型,Transformer實現移植自xAI開源的Grok - 1,并針對推薦系統的具體使用場景進行了適配和調整。它會通過用戶的點贊、回復、轉發等互動歷史,預測用戶對每篇帖子的各類互動概率,最終的內容得分是這些概率的加權組合。并且,該系統已剔除所有手工設計的特征及絕大部分啟發式規則,核心計算工作完全由這款Grok Transformer模型承擔,其核心邏輯就是通過分析用戶互動歷史,判斷內容與用戶的相關性。

從技術棧維度來看,這個倉庫主要使用了Rust和Python兩種編程語言,項目遵循Apache License 2.0開源許可。代碼文件按功能模塊劃分,核心模塊分工明確。phoenix/模塊包含Grok模型適配、推薦系統模型、召回模型等核心代碼,以及模型運行、測試腳本;home - mixer/模塊以Rust語言開發,是推薦系統的“編排層”,包含候選內容補全、查詢數據補全、打分器、過濾器等核心邏輯;thunder/模塊基于Rust開發,負責處理“站內內容”的檢索、反序列化、Kafka消息處理等;candidate - pipeline/模塊則是候選內容流水線相關邏輯,是連接內容源與后續處理的關鍵環節。

該推薦系統有著清晰的工作原理和核心執行流程。從響應用戶的信息流請求開始,算法會通過七個核心階段完成內容篩選與推送。第一步是調取用戶核心數據,系統會抓取用戶近期的互動記錄,如點贊、回復、轉發、點擊等行為,同時調取關注列表、賬號偏好設置等基礎元數據,為算法搭建“用戶畫像”的基礎框架。第二步是抓取兩類候選內容,基于用戶數據,從站內和站外兩大渠道檢索候選內容。第三步是對所有候選內容進行信息補全,確保每一條候選內容的信息維度完整。第四步是在進入核心打分環節前,執行“前置過濾”,剔除不符合要求的內容,如重復帖子、過期內容、用戶本人發布的帖子等。第五步是多維度打分并排序,過濾后的內容會依次調用四款打分器計算“適配得分”。第六步是篩選,算法按得分高低對所有內容排序,選取排名前K的候選內容進入最后環節。第七步是最終驗證后推送,系統會對候選內容做最后一輪合規性、有效性校驗,確認無誤后才會正式推送到用戶的信息流中。

在算法底層設計上,X平臺的推薦系統有五大核心決策。它完全摒棄了手工設計的特征,核心依賴基于Grok的Transformer模型,從用戶的互動行為序列中自主學習內容與用戶的相關性,降低了數據處理流水線和推送基礎設施的復雜度;在排序環節,模型對候選內容采取“隔離計算”方式,確保單篇帖子的得分不受同批次其他內容干擾;召回和排序兩大核心環節均采用多個哈希函數實現嵌入向量的查找,提升了算法運行效率;該模型會同時預測用戶對內容的多種行為概率,讓打分維度更全面;系統基于candidate - pipeline框架搭建了可組合的流水線架構,具備高度的靈活性和可拓展性。

此次開源之際,馬斯克直言:“我們知道這個算法很笨拙,需要大幅改進,但至少你可以實時、透明地看到我們努力改進它的過程。”他還強調,“其他社交媒體公司都沒有這樣做。”這一舉措引發了諸多熱議。對于普通開發者來說,此次開源的價值遠超“看代碼”本身。有網友評論稱,當分配注意力的系統不透明時,豐富性是不可能出現的。將推薦算法開源,把注意力從一個神秘資源變成了一個可理解的系統,可理解性會改變人們的行為。雖然一開始透明度會讓“玩法”更容易被利用,但這是一個階段,開放系統會暴露漏洞、適應變化并不斷改進。不過,也有用戶擔憂開源以后,現在更容易作弊,優質內容瀏覽量很快就會爆炸式增長。整體而言,如果X平臺的“開源 + 透明更新”模式被證明有效,可能會倒逼其他平臺做出改變,畢竟用戶對算法透明的需求只會越來越高。

 
 
更多>同類天脈資訊
全站最新
熱門內容
媒體信息
新傳播周刊
新傳播,傳播新經濟之聲!
網站首頁  |  關于我們  |  聯系方式  |  版權隱私  |  RSS訂閱  |  違規舉報 魯公網安備37010202700497號