真实夫妻露脸自拍视频在线播放-亚洲精品乱码久久久久久蜜月-免费动漫成人av在线观看-中文字幕av三区三级爽-日韩熟女人妻一区二区-亚洲欧美乱日韩乱国产-一二三四区中文字幕在线-国产美女香蕉久久精品-久久视频在线播放视频

MiniMax M2.7發(fā)布:從“大腦”到系統(tǒng),AI龍蝦開啟自我進(jìn)化新征程

   時(shí)間:2026-03-21 16:20 來源:快訊作者:機(jī)器之心Pro

誰能想到,年初爆火的OpenClaw熱度持續(xù)至今,不僅專業(yè)工程師對(duì)其津津樂道,普通大眾也在“錯(cuò)失恐懼”心理的驅(qū)使下,紛紛投身“養(yǎng)龍蝦”熱潮。就在昨天凌晨的GTC 2026大會(huì)上,英偉達(dá)CEO黃仁勛推出了英偉達(dá)版NemoClaw,并著重強(qiáng)調(diào):“當(dāng)下每家企業(yè)都需制定自己的OpenClaw戰(zhàn)略?!边@一觀點(diǎn),無疑為這場(chǎng)熱潮再添一把火。

國(guó)內(nèi)大模型廠商敏銳捕捉到這一趨勢(shì),在“AI養(yǎng)蝦”賽道加速布局。以MiniMax為例,2月底就在其Agent平臺(tái)推出MaxClaw模式。該模式依托強(qiáng)大的M2.5大模型,能在10秒內(nèi)為用戶部署一個(gè)24小時(shí)待命的私人助理。起初,不少人對(duì)MaxClaw持懷疑態(tài)度,但經(jīng)過一段時(shí)間使用,其價(jià)值逐漸得到認(rèn)可。一位用戶分享道:“一個(gè)月前我還吐槽MaxClaw,現(xiàn)在它完全刷新了我的認(rèn)知。云端預(yù)裝好一系列Agent能力后,實(shí)際效果相當(dāng)不錯(cuò)?!边@也讓大家對(duì)MiniMax全新一代大模型在“養(yǎng)蝦”等Agent場(chǎng)景中的表現(xiàn)充滿期待。

今日,MiniMax全新一代大模型M2.7正式亮相,帶來諸多驚喜。此次M2.7的能力升級(jí)涵蓋五大方面,從單點(diǎn)能力突破邁向系統(tǒng)級(jí)Agent能力構(gòu)建。在Agentic指令遵循方面,模型能在包含50多種技能、60 - 150個(gè)功能列表的復(fù)雜環(huán)境中,穩(wěn)定調(diào)用并執(zhí)行流程。多智能體協(xié)作與工程級(jí)Coding實(shí)現(xiàn)原生智能體協(xié)作,減少對(duì)外部編排的依賴,在日志分析、Bug定位、代碼重構(gòu)等真實(shí)工程場(chǎng)景中表現(xiàn)穩(wěn)定。Agent Harness加強(qiáng)編排工具能力,支持Agent Teams、多工具檢索,配合預(yù)置技能構(gòu)建自迭代任務(wù)執(zhí)行鏈路。角色扮演能力全面強(qiáng)化,覆蓋閑聊陪伴、互動(dòng)小說等七大場(chǎng)景,支持10種語言,跨語言角色人格保持一致,適配OpenClaw長(zhǎng)期記憶框架后,智能體角色擁有持久身份與真實(shí)情感。辦公自動(dòng)化支持復(fù)雜Excel/Word/PPT辦公任務(wù)及多輪編輯,效率大幅提升。

值得一提的是,M2.7憑借自身演化出的自迭代能力,科研表現(xiàn)顯著提升。它向以Kaggle競(jìng)賽為基礎(chǔ)構(gòu)建的MLE Bench評(píng)測(cè)體系發(fā)起挑戰(zhàn),在MLE Lite的22道高難度競(jìng)賽題目中斬獲9枚金牌。

為了解M2.7實(shí)戰(zhàn)效果,我們將MiniMax - M2.7接入官方版OpenClaw測(cè)試其執(zhí)行日常任務(wù)能力。本地OpenClaw不具備檢索X的能力,我們給出指令:“安裝search - x skill,配置好密鑰,然后檢索X,看看今天AI領(lǐng)域又有哪些新agent問世?!迸渲煤媚P秃螅琈2.7迅速完成任務(wù)。接著,我們讓它去alphaXiv查看當(dāng)前排名前列的論文,它也出色完成。在搶優(yōu)惠券方面,我們向配備M2.7模型的“龍蝦”提供麥當(dāng)勞MCP地址和密鑰,雖提示未安裝MCP,但它很快找到解決辦法,登錄麥當(dāng)勞查看,優(yōu)惠券已到賬。

在專業(yè)辦公領(lǐng)域,M2.7同樣表現(xiàn)出色。作為一家專業(yè)AI媒體,日常刷選題積累大量選題文檔,其中不少優(yōu)質(zhì)選題被遺忘。借助M2.7,我們將歸檔選題重新利用。例如,我們讓M2.7閱讀每日選題總結(jié)文件夾中的docx格式文檔,總結(jié)今年AI領(lǐng)域發(fā)展趨勢(shì)。它得出幾個(gè)有見地的洞察,如模型軍備競(jìng)賽競(jìng)爭(zhēng)維度轉(zhuǎn)變、AI智能體大爆發(fā)、AI記憶和具身智能蓬勃發(fā)展等,最終總結(jié)頗具參考價(jià)值:“2026年AI正在從‘聊天工具’進(jìn)化為‘能行動(dòng)的智能體’,競(jìng)爭(zhēng)焦點(diǎn)從模型參數(shù)轉(zhuǎn)向推理效率、Agent生態(tài)和安全對(duì)齊。物理世界(機(jī)器人、3D)成為新的主戰(zhàn)場(chǎng),而開源與閉源的博弈將決定行業(yè)格局?!盡2.7在專業(yè)辦公領(lǐng)域取得GDPval - AA榜單開源模型最高分,也就不足為奇。

在編程能力測(cè)試中,我們將M2.7配置到Claude Code,輸入指令:“給我構(gòu)建一個(gè)蒸汽朋克的龍蝦信息網(wǎng),內(nèi)容介紹真正的龍蝦,從網(wǎng)上找素材放入,讓網(wǎng)站信息豐富。”8倍速視頻記錄下,7分多鐘后,我們得到第一版結(jié)果——龍蝦檔案室,可簡(jiǎn)單了解真正龍蝦的分類學(xué)、身體構(gòu)造等知識(shí)。隨后,我們利用MiniMax精心設(shè)計(jì)并開源的技能優(yōu)化項(xiàng)目。先讓配置M2.7的Claude Code安裝技能,很快技能配置就緒,M2.7具備更卓越的前端、全棧等開發(fā)能力。接著,我們使用前端技能優(yōu)化龍蝦檔案室,最終得到結(jié)構(gòu)和動(dòng)畫更現(xiàn)代的網(wǎng)站。

我們還問了MiniMax - M2.7一個(gè)讓M2.5始終無法正確回答的問題:“你認(rèn)識(shí)馬嘉祺嗎?”此次M2.7正確拼寫出馬嘉祺,看來MiniMax已解決這一問題,之前通過“馬嘉祺測(cè)試”辨認(rèn)MiniMax后續(xù)隱身模型的想法難以實(shí)現(xiàn)。

從這些測(cè)試結(jié)果看,M2.7實(shí)現(xiàn)能力蛻變。過去大模型多充當(dāng)“最強(qiáng)大腦”,如今MiniMax推出的M2.7是擁有“手腳、工具和記憶”的多面手系統(tǒng)。當(dāng)模型能自己構(gòu)建工具鏈、優(yōu)化執(zhí)行路徑并在反饋中持續(xù)重寫策略時(shí),其定位發(fā)生根本改變,不再只是被優(yōu)化對(duì)象,而是成為優(yōu)化過程的一部分。

M2.7實(shí)現(xiàn)自我進(jìn)化能力躍遷的關(guān)鍵在于構(gòu)建與運(yùn)轉(zhuǎn)復(fù)雜Agent Harness的能力。該系統(tǒng)由多個(gè)Agent協(xié)作組成,集成大量結(jié)構(gòu)化Skills模塊、外部工具和多種Agent腳手架。在MiniMax內(nèi)部,Agent Harness的價(jià)值得到驗(yàn)證,僅用1人、4天、零代碼,M2系列模型就以“架構(gòu)師”身份自主搭建完整開發(fā)Agent系統(tǒng),并構(gòu)建覆蓋數(shù)據(jù)、訓(xùn)練等的研究型Agent體系,形成“用AI迭代AI”的自我進(jìn)化閉環(huán)。

這種Agent自迭代范式推動(dòng)模型科研能力進(jìn)化。以強(qiáng)化學(xué)習(xí)場(chǎng)景實(shí)驗(yàn)為例,Agent能協(xié)助啟動(dòng)實(shí)驗(yàn),運(yùn)行中持續(xù)監(jiān)控狀態(tài),自動(dòng)完成日志分析等關(guān)鍵步驟。過去需多個(gè)工程師協(xié)作的流程,現(xiàn)在只需他們?cè)陉P(guān)鍵決策節(jié)點(diǎn)介入,M2.7已能承擔(dān)約30% - 50%的實(shí)際工作量。M2.7還能主動(dòng)迭代Agent Harness,對(duì)任務(wù)執(zhí)行系統(tǒng)持續(xù)優(yōu)化。在一項(xiàng)軟件工程任務(wù)中,MiniMax讓M2.7在內(nèi)部scaffold上優(yōu)化模型開發(fā)表現(xiàn),它自主運(yùn)行超100輪迭代,逐步發(fā)現(xiàn)有效改進(jìn)策略,最終在評(píng)測(cè)集上實(shí)現(xiàn)約30%的性能提升。

在MLE Lite評(píng)測(cè)中,MiniMax進(jìn)行三次測(cè)試,每次間隔24小時(shí)迭代,驗(yàn)證模型性能隨迭代次數(shù)增加而持續(xù)攀升。三次測(cè)試平均得牌率達(dá)66.6%,與Gemini - 3.1持平,僅次于GPT - 5.4、Opus - 4.6。其運(yùn)行邏輯圍繞短時(shí)記憶、自反饋與自優(yōu)化三大模塊構(gòu)建簡(jiǎn)易腳手架,每一輪迭代后,Agent生成記憶文件并自我評(píng)估,沉淀問題與改進(jìn)方向,下一輪迭代統(tǒng)一利用歷史記憶與反饋推動(dòng)優(yōu)化。

截至3月10日,MiniMax市值攀升至3800億港元(約合人民幣3350億元),超過百度、京東、攜程等互聯(lián)網(wǎng)巨頭。M2.7的發(fā)布,對(duì)于這家剛完成資本躍升的大模型獨(dú)角獸而言,或許只是其“一周為單位更迭”馬拉松中的一個(gè)節(jié)點(diǎn)。從此次更新重點(diǎn)看,無論是指令遵循、復(fù)雜任務(wù)處理,還是多智能體協(xié)作、代碼能力以及對(duì)日常辦公場(chǎng)景的支持,M2.7都在試圖回答一個(gè)問題:模型能否穩(wěn)定融入真實(shí)工作流,而非僅在演示環(huán)節(jié)令人眼前一亮。

在“龍蝦”等Agent場(chǎng)景走熱后,用戶期待已變,不再滿足于一句話的聰明回答,更在意其能否持續(xù)協(xié)作、理解角色、處理約束、完成復(fù)雜任務(wù)。M2.7的發(fā)布雖未必意味著塵埃落定,但至少表明模型競(jìng)爭(zhēng)焦點(diǎn)正從參數(shù)、榜單和概念,逐漸轉(zhuǎn)向執(zhí)行質(zhì)量、任務(wù)完成度與真實(shí)體驗(yàn)。對(duì)MiniMax而言,這種演進(jìn)契合其一貫風(fēng)格,不急于講宏大故事,而是持續(xù)將能力融入產(chǎn)品、場(chǎng)景、成本結(jié)構(gòu)。大模型的真正價(jià)值不在于制造對(duì)立,而在于作為日?;ぞ?,分擔(dān)繁瑣事務(wù),M2.7為未來共存與協(xié)作提供了更扎實(shí)可靠的起點(diǎn)。

 
 
更多>同類天脈資訊
全站最新
熱門內(nèi)容
媒體信息
新傳播周刊
新傳播,傳播新經(jīng)濟(jì)之聲!