真实夫妻露脸自拍视频在线播放-亚洲精品乱码久久久久久蜜月-免费动漫成人av在线观看-中文字幕av三区三级爽-日韩熟女人妻一区二区-亚洲欧美乱日韩乱国产-一二三四区中文字幕在线-国产美女香蕉久久精品-久久视频在线播放视频

Meta閉源新篇:Muse Spark“偏科”逆襲,AI賽道開(kāi)啟新角逐?

   時(shí)間:2026-04-10 18:55 來(lái)源:快訊作者:鄭佳

meta全新大模型Muse Spark的登場(chǎng),猶如一顆重磅炸彈投入科技圈,激起層層漣漪。這款內(nèi)部代號(hào)為Avocado的模型,不僅是meta超級(jí)智能實(shí)驗(yàn)室(MSL)成立9個(gè)月后的首個(gè)成果,更是扎克伯格在經(jīng)歷Llama 4的挫折后,大刀闊斧進(jìn)行組織與戰(zhàn)略調(diào)整后的首份答卷。令人意外的是,曾經(jīng)高舉“開(kāi)源對(duì)抗閉源”大旗的meta,此次給Muse Spark貼上了“閉源”標(biāo)簽,API也僅向少數(shù)指定合作伙伴開(kāi)放預(yù)覽。

回顧Llama 4的發(fā)布,可謂開(kāi)局不利。它承載著meta的厚望,卻很快陷入信譽(yù)危機(jī)。社區(qū)質(zhì)疑聲不斷,更有爆料稱(chēng)meta在基準(zhǔn)測(cè)試中弄虛作假,用針對(duì)特定任務(wù)微調(diào)的“特供版”刷榜,而普通用戶使用的版本表現(xiàn)大相徑庭。這一事件對(duì)meta AI品牌造成了致命打擊,就連圖靈獎(jiǎng)得主、meta前首席科學(xué)家Yann LeCun離職后也承認(rèn),Llama 4的測(cè)試結(jié)果“確實(shí)被修飾了一點(diǎn)”。

扎克伯格對(duì)此怒不可遏,據(jù)外媒報(bào)道,他對(duì)相關(guān)人員失去信心,直接架空了整個(gè)生成式AI團(tuán)隊(duì),大批人員離開(kāi)。這不僅僅是某個(gè)模型的失敗,更意味著過(guò)去從模型架構(gòu)到研發(fā)流程,從開(kāi)源路線到組織文化的道路可能都行不通了。扎克伯格面臨艱難抉擇,最終選擇全部推翻,在廢墟上重建。

2025年夏天,扎克伯格做出震驚硅谷的決策,以143億美元的天價(jià)拿下數(shù)據(jù)標(biāo)注巨頭Scale AI 49%的無(wú)投票權(quán)股份。更關(guān)鍵的是,時(shí)年不到30歲的華裔創(chuàng)始人Alexandr Wang被請(qǐng)進(jìn)meta,出任首席AI官,統(tǒng)管全新組建的MSL。這位MIT輟學(xué)、19歲創(chuàng)立Scale AI、26歲躋身億萬(wàn)富豪行列的年輕人,被扎克伯格評(píng)價(jià)為“同輩創(chuàng)業(yè)者中最杰出的一位,深刻理解超級(jí)智能的歷史重要性”。

Alexandr Wang上任后雷厲風(fēng)行,從OpenAI、谷歌DeepMind、Anthropic等競(jìng)爭(zhēng)對(duì)手那里,以天價(jià)薪酬挖來(lái)一整支“復(fù)仇者聯(lián)盟”。翻看MSL首批11人名單,7位核心研究員都有華人背景,包括浙大校友畢樹(shù)超、清華校友趙晟佳、中科大校友于佳慧等業(yè)內(nèi)頂尖高手。這支“億元天團(tuán)”的目標(biāo)明確,就是從零開(kāi)始,重寫(xiě)meta的AI命運(yùn)。

Muse Spark究竟實(shí)力如何?meta此次態(tài)度格外坦誠(chéng),在官方博客里列出了一張優(yōu)缺點(diǎn)分明的成績(jī)單。在醫(yī)療和視覺(jué)多模態(tài)領(lǐng)域,Muse Spark表現(xiàn)堪稱(chēng)驚艷。在極高難度的醫(yī)學(xué)開(kāi)放式問(wèn)答評(píng)測(cè)HealthBench Hard中,它取得42.8分,而GPT - 5.4只有40.1分,Gemini 3.1 Pro僅20.6分,差距明顯。這得益于meta與超過(guò)1000名專(zhuān)業(yè)醫(yī)生合作整理訓(xùn)練數(shù)據(jù),為模型配備了強(qiáng)大的專(zhuān)家顧問(wèn)團(tuán)。在科研論文圖表的深度理解測(cè)試(CharXiv Reasoning)中,Muse Spark以86.4分力壓GPT - 5.4的82.8和Gemini 3.1 Pro的80.2。

Muse Spark的應(yīng)用場(chǎng)景也十分豐富。官方案例顯示,對(duì)著食物拍照,它能分析出每種食物的卡路里;能識(shí)別瑜伽動(dòng)作,指出發(fā)力肌群并糾正姿態(tài);甚至還會(huì)操作咖啡機(jī)。可以想象,若應(yīng)用在AI眼鏡上,將帶來(lái)極大便利。

然而,Muse Spark并非完美無(wú)缺。在純邏輯推理和代碼編程方面,它的表現(xiàn)不盡如人意。在ARC AGI 2抽象推理測(cè)試中,僅拿到42.5分,與Gemini 3.1 Pro(76.5分)和GPT - 5.4(76.1分)差距巨大。在軟件工程實(shí)測(cè)(SWE - bench Pro)中,通過(guò)率(52.4%)也略遜于GPT - 5.4的57.7%。

Muse Spark背后真正令人矚目的,是meta公布的一項(xiàng)技術(shù)數(shù)據(jù)。在新重建的技術(shù)棧下,它達(dá)到與上一代Llama 4 Maverick同等性能水平所需的計(jì)算量,減少了超過(guò)一個(gè)數(shù)量級(jí),實(shí)現(xiàn)了10倍以上的效率躍升。這得益于MSL團(tuán)隊(duì)提出的“思維壓縮”(Thought Compression)核心技術(shù)。在強(qiáng)化學(xué)習(xí)訓(xùn)練階段,引入“思考時(shí)間懲罰”機(jī)制,模型回答問(wèn)題時(shí)若思考過(guò)久就會(huì)被“扣分”,從而被迫進(jìn)化,學(xué)會(huì)用更少的推理token、更短的邏輯鏈條解決復(fù)雜問(wèn)題,且準(zhǔn)確率不降反升。Muse Spark還推出多Agent并行推理的“沉思模式”(Contemplating Mode),傳統(tǒng)推理模式是一個(gè)模型獨(dú)自思考,而它是同時(shí)拉起多個(gè)子智能體處理不同維度信息后匯總,在相近響應(yīng)時(shí)間內(nèi),在Humanity‘s Last Exam等評(píng)測(cè)中表現(xiàn)出色。

Muse Spark雖不完美,但用9個(gè)月時(shí)間將meta從Llama 4的輿論困境中拉出,重新回到與GPT - 5.4、Gemini 3.1 Pro同場(chǎng)競(jìng)技的第一梯隊(duì)。對(duì)于扎克伯格和這支“華人天團(tuán)”來(lái)說(shuō),它更像是一個(gè)宣言,標(biāo)志著靠開(kāi)源攢口碑的meta已成為過(guò)去,一個(gè)更務(wù)實(shí)、更有技術(shù)野心的新meta正嶄露頭角。

 
 
更多>同類(lèi)天脈資訊
全站最新
熱門(mén)內(nèi)容
媒體信息
新傳播周刊
新傳播,傳播新經(jīng)濟(jì)之聲!
網(wǎng)站首頁(yè)  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)隱私  |  RSS訂閱  |  違規(guī)舉報(bào) 魯公網(wǎng)安備37010202700497號(hào)