無需編寫代碼,僅憑文本、視頻或動(dòng)作捕捉數(shù)據(jù),就能快速生成并部署機(jī)器人動(dòng)作——這一曾被視為科幻場景的技術(shù),如今在武漢光谷成為現(xiàn)實(shí)。5月9日,湖北人形機(jī)器人創(chuàng)新中心聯(lián)合北京大學(xué)武漢人工智能研究院、北京虛擬動(dòng)點(diǎn)科技,正式發(fā)布人形機(jī)器人動(dòng)作大模型,并同步推出首款應(yīng)用級(jí)產(chǎn)品“潛擎”創(chuàng)作平臺(tái),標(biāo)志著人形機(jī)器人從實(shí)驗(yàn)室研發(fā)向產(chǎn)業(yè)化應(yīng)用邁出關(guān)鍵一步。
該動(dòng)作大模型由MotionMaster虛擬動(dòng)作生成器與UniAct真機(jī)執(zhí)行引擎兩大核心模塊構(gòu)成,可接收高階語義、視頻、音頻等多模態(tài)輸入,并轉(zhuǎn)化為多品牌、多機(jī)型通用的機(jī)器人可執(zhí)行指令。據(jù)北京大學(xué)武漢人工智能研究院具身智能中心研究員何子默介紹,模型具備兩大突破性能力:一是降低開發(fā)門檻,開發(fā)者無需編程基礎(chǔ)即可完成動(dòng)作設(shè)計(jì);二是實(shí)現(xiàn)動(dòng)作指令的跨機(jī)型通用性,且通過數(shù)據(jù)反饋機(jī)制持續(xù)優(yōu)化性能。目前,模型的動(dòng)作成功率、泛化能力與執(zhí)行效率均達(dá)到行業(yè)領(lǐng)先水平,并已面向全行業(yè)開源共享。
針對人形機(jī)器人領(lǐng)域長期存在的“輸入方式單一、動(dòng)作編排困難、開發(fā)者門檻高”等痛點(diǎn),“潛擎”創(chuàng)作平臺(tái)提供了系統(tǒng)性解決方案。潛空間具身智能(武漢)科技有限公司CEO陳睿指出,當(dāng)前市場上300余款人形機(jī)器人產(chǎn)品中,僅少數(shù)能實(shí)現(xiàn)高動(dòng)態(tài)運(yùn)動(dòng),主要原因在于傳統(tǒng)開發(fā)模式依賴專業(yè)編程且兼容性差。“潛擎”平臺(tái)通過整合動(dòng)作大模型技術(shù),支持用戶以文本描述、視頻示范或動(dòng)作捕捉數(shù)據(jù)直接生成機(jī)器人動(dòng)作,實(shí)現(xiàn)“一次創(chuàng)作、多機(jī)通用、全場景適配”,大幅縮短開發(fā)周期并降低成本。
作為湖北具身智能產(chǎn)業(yè)的核心公共平臺(tái),湖北人形機(jī)器人創(chuàng)新中心為本次技術(shù)突破提供了全鏈條支撐。該中心運(yùn)營負(fù)責(zé)人黃全周表示,中心不僅構(gòu)建了覆蓋數(shù)據(jù)采集、場地測試、真機(jī)驗(yàn)證到場景落地的完整研發(fā)環(huán)境,還通過聯(lián)動(dòng)產(chǎn)學(xué)研資源推動(dòng)技術(shù)快速轉(zhuǎn)化。例如,在模型訓(xùn)練階段,中心聯(lián)合高校與企業(yè)提供海量動(dòng)作數(shù)據(jù);在應(yīng)用推廣階段,協(xié)助對接工業(yè)制造、物流倉儲(chǔ)等潛在場景,加速技術(shù)從實(shí)驗(yàn)室到市場的落地。
發(fā)布會(huì)上,多項(xiàng)產(chǎn)業(yè)生態(tài)合作同步落地。潛空間科技與光谷東智、格藍(lán)若、宇樹科技、樂聚機(jī)器人等企業(yè)簽署合作協(xié)議,圍繞數(shù)據(jù)服務(wù)、模型訓(xùn)練、場景落地等展開協(xié)同;湖北人形機(jī)器人創(chuàng)新中心則與虛擬動(dòng)點(diǎn)、飛闊科技、青瞳視覺等機(jī)構(gòu)達(dá)成戰(zhàn)略合作,共同完善產(chǎn)業(yè)生態(tài)鏈。這些合作標(biāo)志著湖北在具身智能領(lǐng)域已形成“技術(shù)研發(fā)-場景驗(yàn)證-商業(yè)應(yīng)用”的閉環(huán)體系,為打造全國領(lǐng)先的人形機(jī)器人產(chǎn)業(yè)高地奠定基礎(chǔ)。





















