真实夫妻露脸自拍视频在线播放-亚洲精品乱码久久久久久蜜月-免费动漫成人av在线观看-中文字幕av三区三级爽-日韩熟女人妻一区二区-亚洲欧美乱日韩乱国产-一二三四区中文字幕在线-国产美女香蕉久久精品-久久视频在线播放视频

小米AI逆襲:雷軍帶隊(duì)突圍,大模型賽道給馬斯克“上了一課”?

   時(shí)間:2026-03-20 18:37 來源:快訊作者:王婷

當(dāng)小米正式發(fā)布MiMo-V2-Pro大模型時(shí),科技圈的目光不約而同地轉(zhuǎn)向了馬斯克——這位以顛覆性創(chuàng)新著稱的企業(yè)家,此刻正因xAI的處境陷入尷尬。2023年成立的xAI雖背靠500億美元融資和OpenAI、DeepMind等頂尖機(jī)構(gòu)的核心團(tuán)隊(duì),但其最新推出的Grok 4.20 Beta在Artificial Analysis Intelligence Index評(píng)測中僅獲48分,而小米的MiMo-V2-Pro卻以49分險(xiǎn)勝。這場看似偶然的分?jǐn)?shù)超越,實(shí)則揭示了AI賽道競爭格局的微妙變化。

小米的AI征程始于2023年4月成立的AI實(shí)驗(yàn)室大模型團(tuán)隊(duì),但真正發(fā)力是在2024年底至2025年初組建的通用基礎(chǔ)大模型Core團(tuán)隊(duì)。這個(gè)由雷軍直接推動(dòng)的項(xiàng)目,在技術(shù)架構(gòu)上并未追求標(biāo)新立異:1T參數(shù)、42B激活參數(shù)、100萬token上下文窗口,以及MoE混合專家架構(gòu)等設(shè)計(jì),均屬于行業(yè)主流方案。真正讓MiMo-V2-Pro脫穎而出的,是其獨(dú)創(chuàng)的后訓(xùn)練技術(shù)體系。

針對(duì)大模型訓(xùn)練中普遍存在的"蹺蹺板效應(yīng)"——強(qiáng)化某一能力時(shí)必然削弱其他能力,小米研發(fā)了MOPD(多教師在線策略蒸餾)技術(shù)。該技術(shù)通過構(gòu)建代碼、搜索、數(shù)學(xué)推理等領(lǐng)域的專家教師模型,讓學(xué)生模型在生成回答時(shí)同時(shí)接受多個(gè)教師的實(shí)時(shí)監(jiān)督。這種訓(xùn)練方式不僅使模型在AIME 2025數(shù)學(xué)競賽中取得94.1分,更突破性地讓部分學(xué)生模型超越了教師水平。北京大學(xué)計(jì)算機(jī)學(xué)院參與研發(fā)的ARL-Tangram訓(xùn)練基礎(chǔ)設(shè)施系統(tǒng),則通過動(dòng)態(tài)資源分配解決了傳統(tǒng)RL框架中97%算力空轉(zhuǎn)的問題,將外部資源消耗降低71.2%。

在真實(shí)場景訓(xùn)練方面,小米構(gòu)建了覆蓋代碼、終端、網(wǎng)頁開發(fā)和通用任務(wù)的四大類場景體系。代碼agent直接從GitHub Issues中提取訓(xùn)練數(shù)據(jù),在修改代碼、運(yùn)行測試、查看報(bào)錯(cuò)的完整閉環(huán)中學(xué)習(xí);網(wǎng)頁開發(fā)agent通過Playwright執(zhí)行生成代碼并錄制視頻,用多模態(tài)視覺判別器評(píng)估動(dòng)態(tài)布局效果。這種訓(xùn)練方式使模型獲得了類似人類實(shí)習(xí)生的問題解決能力——當(dāng)其他模型還在封閉環(huán)境中做選擇題時(shí),MiMo-V2-Pro已經(jīng)在開放場景中處理綜合任務(wù)。

對(duì)于小米而言,MiMo-V2-Pro的意義遠(yuǎn)不止于技術(shù)突破。這家長期被貼上"硬件性價(jià)比之王"標(biāo)簽的企業(yè),正通過AI技術(shù)重塑品牌認(rèn)知。2023年雷軍提出的"(軟件×硬件)^AI"戰(zhàn)略,在MiMo-V2-Pro身上得到首次驗(yàn)證:該模型不僅在Artificial Analysis Intelligence Index全球排名中位列前十、中國第二,更通過"云-邊-端"協(xié)同架構(gòu)與小米汽車業(yè)務(wù)形成深度聯(lián)動(dòng)。云端大模型負(fù)責(zé)復(fù)雜決策和訓(xùn)練,端側(cè)輕量模型處理實(shí)時(shí)推理,這種技術(shù)路線在特斯拉Grok與FSD的淺層聯(lián)動(dòng)面前展現(xiàn)出更清晰的協(xié)同路徑。

但技術(shù)突破的另一面是現(xiàn)實(shí)的挑戰(zhàn)。MiMo-V2-Pro在SWE-bench Verified編程測試集中取得的78.0%得分,因測試集數(shù)據(jù)污染問題引發(fā)爭議。OpenAI研究顯示,多個(gè)前沿模型僅憑任務(wù)ID就能復(fù)述正確答案,使得該測試集的參考價(jià)值大幅下降。而小米未公布的SWE-bench Pro成績(當(dāng)前最高分僅57.7%)、缺席的ARC-AGI-2推理測試(人類平均60分)和LiveCodeBench v6編程評(píng)測,都暴露出模型在抗污染測試和泛化能力上的未知領(lǐng)域。MiMo-V2-Pro權(quán)重未開源的決定,雖以"模型穩(wěn)定性不足"解釋,但也反映出技術(shù)成熟度方面的隱憂。

當(dāng)雷軍在微博寫下"AI領(lǐng)域?qū)嶋H進(jìn)展可能比大家看到的要快很多"時(shí),這場由分?jǐn)?shù)引發(fā)的關(guān)注正在演變?yōu)閷?duì)AI技術(shù)路線的深度思考。特斯拉Digital Optimus項(xiàng)目試圖構(gòu)建的"慢思考System 2+快反應(yīng)System 1"雙系統(tǒng)架構(gòu),與小米的云端蒸餾路線形成鮮明對(duì)比。在AI技術(shù)從實(shí)驗(yàn)室走向產(chǎn)業(yè)應(yīng)用的關(guān)鍵階段,如何平衡技術(shù)創(chuàng)新與商業(yè)落地,如何構(gòu)建真正可持續(xù)的AI生態(tài),將成為決定企業(yè)命運(yùn)的新考題。

 
 
更多>同類天脈資訊
全站最新
熱門內(nèi)容
媒體信息
新傳播周刊
新傳播,傳播新經(jīng)濟(jì)之聲!
網(wǎng)站首頁  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)隱私  |  RSS訂閱  |  違規(guī)舉報(bào) 魯公網(wǎng)安備37010202700497號(hào)