真实夫妻露脸自拍视频在线播放-亚洲精品乱码久久久久久蜜月-免费动漫成人av在线观看-中文字幕av三区三级爽-日韩熟女人妻一区二区-亚洲欧美乱日韩乱国产-一二三四区中文字幕在线-国产美女香蕉久久精品-久久视频在线播放视频

小米認(rèn)領(lǐng)爆款模型!雷軍稱超越馬斯克xAI,MiMo-V2-Pro將開(kāi)源引期待

   時(shí)間:2026-03-19 12:45 來(lái)源:快訊作者:趙靜

近日,科技圈迎來(lái)一則重磅消息:此前在OpenRouter平臺(tái)引發(fā)廣泛關(guān)注的神秘模型Hunter Alpha,終于揭開(kāi)神秘面紗,其真實(shí)身份竟是小米最新發(fā)布的MiMo-V2-Pro早期內(nèi)部測(cè)試版本。與此同時(shí),小米正式推出MiMo-V2家族三款全新模型,除MiMo-V2-Pro外,還包括MiMo-V2-Omni和MiMo-V2-TTS,另一備受猜測(cè)的匿名模型Healer Alpha也確認(rèn)對(duì)應(yīng)MiMo-V2-Omni。

一周前,Hunter Alpha悄然上線全球最大的API聚合平臺(tái)OpenRouter,憑借出色表現(xiàn)迅速成為焦點(diǎn)。上線后,其調(diào)用量持續(xù)攀升,連續(xù)多日占據(jù)日榜榜首,累計(jì)調(diào)用量突破1T tokens。小米官方介紹,經(jīng)過(guò)一周的持續(xù)迭代與優(yōu)化,MiMo-V2-Pro在長(zhǎng)文處理能力以及Agent場(chǎng)景穩(wěn)定性方面實(shí)現(xiàn)顯著提升。雷軍也親自為新品站臺(tái),他表示MiMo-V2-Pro在榜單上的表現(xiàn)已超越馬斯克旗下xAI的Grok,并透露小米在AI領(lǐng)域雖一直保持低調(diào),但實(shí)際進(jìn)展遠(yuǎn)超外界想象,今年在AI領(lǐng)域的研發(fā)和資本投入將超過(guò)160億元。

MiMo-V2家族的三款模型各有側(cè)重。MiMo-V2-Pro作為旗艦?zāi)P?,專為高?qiáng)度Agent工作場(chǎng)景打造。它總參數(shù)量超過(guò)1T,激活參數(shù)為42B,采用創(chuàng)新的混合注意力架構(gòu),支持1M超長(zhǎng)上下文。該模型在匿名測(cè)試階段就引發(fā)大量關(guān)注,OpenClaw早早給予支持。從技術(shù)規(guī)格看,相比前代MiMo-V2-Flash,其總參數(shù)量擴(kuò)大約3倍,混合注意力比例從5:1提升到7:1,在參數(shù)規(guī)模增大的同時(shí)維持較高推理效率,輕量級(jí)MTP層也進(jìn)一步提升了生成速度。在后訓(xùn)練階段,團(tuán)隊(duì)針對(duì)更廣泛的Agent場(chǎng)景持續(xù)Scaling,使模型逐漸能勝任真實(shí)生產(chǎn)環(huán)境中的復(fù)雜執(zhí)行工作,朝著“生產(chǎn)力系統(tǒng)的大腦”定位推進(jìn)。在大模型綜合智能排行榜Artificial Analysis上,MiMo-V2-Pro位列全球第八、國(guó)內(nèi)第二。在實(shí)際使用中,它在OpenClaw、Claude Code等智能體框架中展現(xiàn)出突出的端到端任務(wù)完成能力,官方稱其整體使用體感超越Claude Sonnet 4.6,逼近Claude Opus 4.6,且API定價(jià)僅為后者的1/5。

MiMo-V2-Pro在編程領(lǐng)域也重點(diǎn)發(fā)力。小米內(nèi)部工程師深度評(píng)測(cè)顯示,其整體體驗(yàn)接近Claude Opus 4.6,在系統(tǒng)設(shè)計(jì)、任務(wù)規(guī)劃、代碼風(fēng)格以及問(wèn)題解決路徑上展現(xiàn)出更高階的代碼智能。在Hunter Alpha測(cè)試階段,調(diào)用量最高的幾款應(yīng)用大多是編程工具,側(cè)面證明其在真實(shí)研發(fā)場(chǎng)景中具備較高的可用性和可靠性。目前,MiMo-V2-Pro已正式開(kāi)放API服務(wù),支持1M上下文長(zhǎng)度,并根據(jù)使用量分段計(jì)價(jià):256K上下文以內(nèi),輸入1美元/百萬(wàn)tokens,輸出3美元/百萬(wàn)tokens;1M上下文以內(nèi),輸入2美元/百萬(wàn)tokens,輸出6美元/百萬(wàn)tokens。與智譜面向真實(shí)Agent長(zhǎng)鏈路任務(wù)深度優(yōu)化的模型GLM-5-Turbo相比,小米模型定價(jià)整體略高,但此前Hunter Alpha在Claw-eval測(cè)試中擊敗了GLM-5。

MiMo-V2-Omni則瞄準(zhǔn)現(xiàn)實(shí)世界中復(fù)雜的多模態(tài)交互與執(zhí)行場(chǎng)景。在音頻理解方面,它支持從環(huán)境聲分類、多說(shuō)話人分離,到音頻—視覺(jué)聯(lián)合推理,再到超過(guò)10小時(shí)長(zhǎng)音頻的連續(xù)理解,綜合表現(xiàn)超過(guò)Gemini 3 Pro,是當(dāng)前最強(qiáng)的音頻理解基座模型之一。在圖像理解方面,展現(xiàn)出強(qiáng)大的多學(xué)科視覺(jué)推理與復(fù)雜圖表分析能力,效果超過(guò)Claude Opus 4.6,逼近Gemini 3 Pro等頂尖閉源模型。在視頻理解方面,支持原生音視頻聯(lián)合輸入,實(shí)現(xiàn)真正意義上的多模態(tài)視頻理解,通過(guò)創(chuàng)新性的視頻預(yù)訓(xùn)練,具備更強(qiáng)的情境感知與未來(lái)推理能力。在與真實(shí)數(shù)字環(huán)境交互的評(píng)測(cè)基準(zhǔn)上,其整體表現(xiàn)比肩Gemini 3 Pro。目前,MiMo-V2-Omni已正式開(kāi)放API服務(wù),支持256K上下文長(zhǎng)度,定價(jià)為輸入0.4美元/百萬(wàn)tokens,輸出2美元/百萬(wàn)tokens。

一同發(fā)布的MiMo-V2-TTS是一款自研的語(yǔ)音合成大模型。它基于自研Audio Tokenizer與多碼本語(yǔ)音—文本聯(lián)合建模架構(gòu),經(jīng)過(guò)上億小時(shí)語(yǔ)音數(shù)據(jù)的大規(guī)模預(yù)訓(xùn)練和多維度強(qiáng)化學(xué)習(xí),具備高度可控的多粒度語(yǔ)音風(fēng)格控制能力。不僅能完成整體風(fēng)格定調(diào),還能對(duì)局部情緒表達(dá)進(jìn)行精準(zhǔn)調(diào)節(jié)。訓(xùn)練時(shí)先通過(guò)超大規(guī)模語(yǔ)音—文本混合預(yù)訓(xùn)練建立跨模態(tài)對(duì)齊、理解和生成能力,再通過(guò)少量高質(zhì)量監(jiān)督數(shù)據(jù)微調(diào)獲得可泛化的多粒度、多風(fēng)格指令控制能力。為激發(fā)模型在預(yù)訓(xùn)練階段積累的高表現(xiàn)力語(yǔ)音生成潛力,團(tuán)隊(duì)引入多維度強(qiáng)化學(xué)習(xí),圍繞更自然的韻律、更穩(wěn)定的音質(zhì)、更準(zhǔn)確的字詞表達(dá)、更高質(zhì)量的音色克隆以及不同場(chǎng)景下更合適的語(yǔ)氣與表達(dá)方式進(jìn)行持續(xù)優(yōu)化。得益于多層碼本建模架構(gòu),它能在高保真的離散token空間中建模語(yǔ)音,最大限度保留原始語(yǔ)音中的豐富信息,讓強(qiáng)化學(xué)習(xí)階段能更直接地利用語(yǔ)音相關(guān)獎(jiǎng)勵(lì)信號(hào)對(duì)模型進(jìn)行優(yōu)化。

小米此次發(fā)布的三款模型,顯示出其押注一套面向Agent時(shí)代的通用智能底座的決心。此前匿名爆紅也讓市場(chǎng)對(duì)其他模型廠家充滿期待。近日有消息稱,DeepSeek-V4將于4月正式上線,作為梁文鋒打磨已久的多模態(tài)大模型,除在Coding能力上躍升外,還將在LTM(long term memory長(zhǎng)期記憶)上取得突破,這恰好是智能體當(dāng)前的短板之一。隨著國(guó)內(nèi)各模型廠家的戰(zhàn)略和人才調(diào)整,今年國(guó)內(nèi)大模型市場(chǎng)必將精彩紛呈。

 
 
更多>同類天脈資訊
全站最新
熱門內(nèi)容
媒體信息
新傳播周刊
新傳播,傳播新經(jīng)濟(jì)之聲!