小米AI逆襲：雷軍帶隊(duì)突圍，大模型賽道給馬斯克“上了一課”？

時(shí)間：2026-03-20 18:37 來源：快訊作者：王婷

當(dāng)小米正式發(fā)布MiMo-V2-Pro大模型時(shí)，科技圈的目光不約而同地轉(zhuǎn)向了馬斯克——這位以顛覆性創(chuàng)新著稱的企業(yè)家，此刻正因xAI的處境陷入尷尬。2023年成立的xAI雖背靠500億美元融資和OpenAI、DeepMind等頂尖機(jī)構(gòu)的核心團(tuán)隊(duì)，但其最新推出的Grok 4.20 Beta在Artificial Analysis Intelligence Index評(píng)測中僅獲48分，而小米的MiMo-V2-Pro卻以49分險(xiǎn)勝。這場看似偶然的分?jǐn)?shù)超越，實(shí)則揭示了AI賽道競爭格局的微妙變化。

小米的AI征程始于2023年4月成立的AI實(shí)驗(yàn)室大模型團(tuán)隊(duì)，但真正發(fā)力是在2024年底至2025年初組建的通用基礎(chǔ)大模型Core團(tuán)隊(duì)。這個(gè)由雷軍直接推動(dòng)的項(xiàng)目，在技術(shù)架構(gòu)上并未追求標(biāo)新立異：1T參數(shù)、42B激活參數(shù)、100萬token上下文窗口，以及MoE混合專家架構(gòu)等設(shè)計(jì)，均屬于行業(yè)主流方案。真正讓MiMo-V2-Pro脫穎而出的，是其獨(dú)創(chuàng)的后訓(xùn)練技術(shù)體系。

針對(duì)大模型訓(xùn)練中普遍存在的"蹺蹺板效應(yīng)"——強(qiáng)化某一能力時(shí)必然削弱其他能力，小米研發(fā)了MOPD（多教師在線策略蒸餾）技術(shù)。該技術(shù)通過構(gòu)建代碼、搜索、數(shù)學(xué)推理等領(lǐng)域的專家教師模型，讓學(xué)生模型在生成回答時(shí)同時(shí)接受多個(gè)教師的實(shí)時(shí)監(jiān)督。這種訓(xùn)練方式不僅使模型在AIME 2025數(shù)學(xué)競賽中取得94.1分，更突破性地讓部分學(xué)生模型超越了教師水平。北京大學(xué)計(jì)算機(jī)學(xué)院參與研發(fā)的ARL-Tangram訓(xùn)練基礎(chǔ)設(shè)施系統(tǒng)，則通過動(dòng)態(tài)資源分配解決了傳統(tǒng)RL框架中97%算力空轉(zhuǎn)的問題，將外部資源消耗降低71.2%。

在真實(shí)場景訓(xùn)練方面，小米構(gòu)建了覆蓋代碼、終端、網(wǎng)頁開發(fā)和通用任務(wù)的四大類場景體系。代碼agent直接從GitHub Issues中提取訓(xùn)練數(shù)據(jù)，在修改代碼、運(yùn)行測試、查看報(bào)錯(cuò)的完整閉環(huán)中學(xué)習(xí)；網(wǎng)頁開發(fā)agent通過Playwright執(zhí)行生成代碼并錄制視頻，用多模態(tài)視覺判別器評(píng)估動(dòng)態(tài)布局效果。這種訓(xùn)練方式使模型獲得了類似人類實(shí)習(xí)生的問題解決能力——當(dāng)其他模型還在封閉環(huán)境中做選擇題時(shí)，MiMo-V2-Pro已經(jīng)在開放場景中處理綜合任務(wù)。

對(duì)于小米而言，MiMo-V2-Pro的意義遠(yuǎn)不止于技術(shù)突破。這家長期被貼上"硬件性價(jià)比之王"標(biāo)簽的企業(yè)，正通過AI技術(shù)重塑品牌認(rèn)知。2023年雷軍提出的"（軟件×硬件）^AI"戰(zhàn)略，在MiMo-V2-Pro身上得到首次驗(yàn)證：該模型不僅在Artificial Analysis Intelligence Index全球排名中位列前十、中國第二，更通過"云-邊-端"協(xié)同架構(gòu)與小米汽車業(yè)務(wù)形成深度聯(lián)動(dòng)。云端大模型負(fù)責(zé)復(fù)雜決策和訓(xùn)練，端側(cè)輕量模型處理實(shí)時(shí)推理，這種技術(shù)路線在特斯拉Grok與FSD的淺層聯(lián)動(dòng)面前展現(xiàn)出更清晰的協(xié)同路徑。

但技術(shù)突破的另一面是現(xiàn)實(shí)的挑戰(zhàn)。MiMo-V2-Pro在SWE-bench Verified編程測試集中取得的78.0%得分，因測試集數(shù)據(jù)污染問題引發(fā)爭議。OpenAI研究顯示，多個(gè)前沿模型僅憑任務(wù)ID就能復(fù)述正確答案，使得該測試集的參考價(jià)值大幅下降。而小米未公布的SWE-bench Pro成績（當(dāng)前最高分僅57.7%）、缺席的ARC-AGI-2推理測試（人類平均60分）和LiveCodeBench v6編程評(píng)測，都暴露出模型在抗污染測試和泛化能力上的未知領(lǐng)域。MiMo-V2-Pro權(quán)重未開源的決定，雖以"模型穩(wěn)定性不足"解釋，但也反映出技術(shù)成熟度方面的隱憂。

當(dāng)雷軍在微博寫下"AI領(lǐng)域?qū)嶋H進(jìn)展可能比大家看到的要快很多"時(shí)，這場由分?jǐn)?shù)引發(fā)的關(guān)注正在演變?yōu)閷?duì)AI技術(shù)路線的深度思考。特斯拉Digital Optimus項(xiàng)目試圖構(gòu)建的"慢思考System 2+快反應(yīng)System 1"雙系統(tǒng)架構(gòu)，與小米的云端蒸餾路線形成鮮明對(duì)比。在AI技術(shù)從實(shí)驗(yàn)室走向產(chǎn)業(yè)應(yīng)用的關(guān)鍵階段，如何平衡技術(shù)創(chuàng)新與商業(yè)落地，如何構(gòu)建真正可持續(xù)的AI生態(tài)，將成為決定企業(yè)命運(yùn)的新考題。

03-20

抖音集團(tuán)布局常州：全資成立恒途電商，注冊資本百萬拓展新業(yè)務(wù)

03-20

蘇寧易購Suning Fun開業(yè)在即！IP Leo來襲，打造Z世代潮流新地標(biāo)

03-20

國內(nèi)金飾價(jià)格顯著回落周生生足金單日下跌55元多個(gè)品牌跟跌

03-20

2026深圳國際數(shù)控機(jī)床展：大型展臺(tái)制作工廠交付實(shí)力大揭秘

03-20

特斯拉或大規(guī)模采購中國光伏設(shè)備概念股大漲太空與地面光伏訂單齊推進(jìn)

03-20

亞馬遜低調(diào)收購瑞士機(jī)器人企業(yè) 自動(dòng)化配送或開啟“最后一公里”新篇章

03-20

TikTok Shop引領(lǐng)美國興趣電商新潮流跨境賣家借ACE方法論開啟品牌增長新篇

03-20

東方基金董事長換帥：劉鴻鵬接棒，千億規(guī)?；鹞磥碜呦蛞P(guān)注

投資時(shí)間網(wǎng)、標(biāo)點(diǎn)財(cái)經(jīng)研究員注意到，劉鴻鵬擁有豐富的證券、基金從業(yè)經(jīng)驗(yàn)，在東方基金任職15年，擔(dān)任公司總經(jīng)理已近10年。從數(shù)據(jù)可以看出，在董事會(huì)的帶領(lǐng)下，劉鴻鵬與經(jīng)營班子同心協(xié)力，實(shí)現(xiàn)了公司資產(chǎn)管理規(guī)模與綜合…

03-20