阿里巴巴達(dá)摩院在具身智能領(lǐng)域取得重大突破,正式推出具身智能大腦基礎(chǔ)模型RynnBrain,并同步開源包含30B MoE架構(gòu)在內(nèi)的7個(gè)全尺寸模型。這一成果標(biāo)志著機(jī)器人首次具備時(shí)空記憶與物理世界推理能力,在16項(xiàng)國際權(quán)威評(píng)測中刷新紀(jì)錄,性能超越谷歌Gemini Robotics ER 1.5等頂尖模型。
傳統(tǒng)機(jī)器人執(zhí)行任務(wù)時(shí)若被中斷,往往需要重新規(guī)劃流程。RynnBrain通過引入時(shí)空記憶模塊,使機(jī)器人能精準(zhǔn)記錄任務(wù)的時(shí)間節(jié)點(diǎn)與空間位置。例如,當(dāng)機(jī)器人在搬運(yùn)物品途中被要求優(yōu)先處理其他事務(wù)時(shí),系統(tǒng)可自動(dòng)保存當(dāng)前任務(wù)狀態(tài),待完成緊急任務(wù)后無縫銜接原任務(wù)流程。這種能力源于模型對(duì)物理世界因果關(guān)系的深度理解,而非簡單的條件反射式響應(yīng)。
在技術(shù)架構(gòu)層面,RynnBrain采用混合專家(MoE)設(shè)計(jì),其中30B參數(shù)模型通過動(dòng)態(tài)路由機(jī)制實(shí)現(xiàn)高效計(jì)算。實(shí)驗(yàn)數(shù)據(jù)顯示,基于該模型訓(xùn)練的具身規(guī)劃模塊,僅需數(shù)百條場景數(shù)據(jù)微調(diào)即可達(dá)到SOTA水平,其場景解析準(zhǔn)確率較Gemini 3 Pro提升23%。這種可擴(kuò)展性使模型能快速適配導(dǎo)航、操作等不同應(yīng)用場景,為行業(yè)提供標(biāo)準(zhǔn)化基礎(chǔ)框架。
達(dá)摩院同步開源的RynnBrain-Bench評(píng)測基準(zhǔn),首次構(gòu)建了包含時(shí)空細(xì)粒度任務(wù)的評(píng)估體系。該基準(zhǔn)涵蓋動(dòng)態(tài)障礙物避讓、多階段任務(wù)銜接等200余個(gè)測試場景,填補(bǔ)了行業(yè)在復(fù)雜物理環(huán)境評(píng)估方面的空白。配套開源的還有WorldVLA融合模型與RynnRCP機(jī)器人通信協(xié)議,形成從基礎(chǔ)能力到系統(tǒng)部署的完整技術(shù)棧。
據(jù)項(xiàng)目負(fù)責(zé)人介紹,RynnBrain的研發(fā)突破了傳統(tǒng)具身智能"大腦-小腦"分離架構(gòu)的限制,通過統(tǒng)一模型實(shí)現(xiàn)認(rèn)知推理與運(yùn)動(dòng)控制的協(xié)同優(yōu)化。目前團(tuán)隊(duì)正與多家制造業(yè)企業(yè)合作,將技術(shù)應(yīng)用于精密裝配、柔性物流等場景,推動(dòng)AI從數(shù)字空間向真實(shí)物理世界的滲透。開源社區(qū)已收到來自23個(gè)國家的開發(fā)者提交的改進(jìn)方案,形成技術(shù)迭代的良性生態(tài)。


















