真实夫妻露脸自拍视频在线播放-亚洲精品乱码久久久久久蜜月-免费动漫成人av在线观看-中文字幕av三区三级爽-日韩熟女人妻一区二区-亚洲欧美乱日韩乱国产-一二三四区中文字幕在线-国产美女香蕉久久精品-久久视频在线播放视频

智元GE-Sim 2.0發(fā)布:構(gòu)建可交互“模型世界” 引領(lǐng)機(jī)器人自主進(jìn)化新篇章

   時(shí)間:2026-04-12 05:21 來(lái)源:快訊作者:文匯報(bào)

在機(jī)器人技術(shù)領(lǐng)域,一場(chǎng)具有里程碑意義的變革正在悄然發(fā)生。智元機(jī)器人公司近日取得重大突破,推出世界模型迭代版本Genie Envisioner World Simulator 2.0(GE-Sim 2.0),為機(jī)器人行業(yè)帶來(lái)了全新的發(fā)展思路,有望推動(dòng)機(jī)器人從被動(dòng)執(zhí)行走向自主進(jìn)化。

長(zhǎng)期以來(lái),機(jī)器人技術(shù)發(fā)展面臨諸多挑戰(zhàn)。真實(shí)世界中,機(jī)器人策略訓(xùn)練高度依賴(lài)實(shí)際環(huán)境,不僅評(píng)估成本高昂,效率也極為有限,高質(zhì)量數(shù)據(jù)的獲取與擴(kuò)展更是成為制約機(jī)器人發(fā)展的關(guān)鍵瓶頸。傳統(tǒng)世界模型大多僅聚焦于“狀態(tài)”建模,而忽略了機(jī)器人動(dòng)作對(duì)環(huán)境演化的重要影響。機(jī)器人面對(duì)的世界是連續(xù)變化的,動(dòng)作不僅是輸出,更是影響環(huán)境演化的核心變量。機(jī)器人做了什么動(dòng)作、動(dòng)作如何改變世界、世界又如何反饋給策略,這些問(wèn)題在傳統(tǒng)模型中未能得到有效解決。

智元機(jī)器人敏銳地察覺(jué)到這一痛點(diǎn),在技術(shù)路徑上大膽創(chuàng)新,沿著兩條主線推進(jìn)世界模型的發(fā)展。一條是世界動(dòng)作模型(World Action Model),專(zhuān)注于對(duì)動(dòng)作表征進(jìn)行深度建模;另一條是世界模擬器(World Simulator),致力于打造一個(gè)可交互、可推演、可訓(xùn)練的完整環(huán)境。通過(guò)將“狀態(tài) - 動(dòng)作 - 狀態(tài)演化”作為統(tǒng)一建模對(duì)象,智元讓世界模型成為策略學(xué)習(xí)與動(dòng)作生成的基礎(chǔ)表示層,為機(jī)器人理解世界提供了全新的視角。

在探索過(guò)程中,智元取得了一系列階段性成果。先是構(gòu)建了EnerVerse,將具身場(chǎng)景拓展為可計(jì)算的4D世界模型;接著推出Genie Envisioner Act(GE - Act),實(shí)現(xiàn)從世界表征能力到動(dòng)作軌跡生成的跨越;又通過(guò)Act2Goal,讓機(jī)器人具備目標(biāo)驅(qū)動(dòng)的長(zhǎng)程控制能力。這些探索使世界模型首次具備承載動(dòng)作策略的能力,為后續(xù)發(fā)展奠定了堅(jiān)實(shí)基礎(chǔ)。

然而,智元并未滿(mǎn)足于此。為了讓機(jī)器人能在更真實(shí)、穩(wěn)定、高效的環(huán)境中訓(xùn)練,降低真實(shí)世界試錯(cuò)成本,智元在強(qiáng)化世界動(dòng)作模型建模能力的同時(shí),同步推動(dòng)世界模型向可交互模擬器能力發(fā)展。通過(guò)EnerVerse - AC引入動(dòng)作條件化世界建模,使模型能夠基于動(dòng)作進(jìn)行未來(lái)推演;借助Genie Envisioner Sim(GE - Sim 1.0)構(gòu)建可用于策略閉環(huán)評(píng)估的神經(jīng)模擬器;并從場(chǎng)景一致性、動(dòng)作正確性與語(yǔ)義對(duì)齊等多個(gè)維度,對(duì)世界模型的模擬能力進(jìn)行系統(tǒng)評(píng)估。

在此基礎(chǔ)上,智元還建立了一套全新的數(shù)據(jù)與訓(xùn)練范式。將真實(shí)數(shù)據(jù)與生成數(shù)據(jù)相結(jié)合,使策略訓(xùn)練既保證真實(shí)性,又增強(qiáng)泛化能力。同時(shí),提出Real2Edit2Real流程,讓真實(shí)數(shù)據(jù)從被動(dòng)采集轉(zhuǎn)變?yōu)橹鲃?dòng)擴(kuò)展與編輯的基礎(chǔ),顯著提升數(shù)據(jù)規(guī)模與多樣性。

此次發(fā)布的GE - Sim 2.0,是智元技術(shù)創(chuàng)新的集大成者。它不再僅僅是一個(gè)生成模型,而是一個(gè)真正意義上的“可操作世界”。該模型能夠嚴(yán)格響應(yīng)機(jī)器人動(dòng)作信號(hào),生成高保真的環(huán)境變化,且嚴(yán)格遵循物理與語(yǔ)義邏輯。它支持分鐘級(jí)長(zhǎng)時(shí)序穩(wěn)定推演,可將零散視頻片段轉(zhuǎn)化為完整任務(wù)過(guò)程的連續(xù)生成。多視角視覺(jué)、跨視角3D一致性與機(jī)器人本體狀態(tài)被統(tǒng)一建模,讓機(jī)器人面對(duì)的不再是簡(jiǎn)單的“畫(huà)面”,而是一個(gè)完整、可交互的具身世界。內(nèi)置激勵(lì)模型使模型具備自評(píng)估能力,可基于文本對(duì)生成狀態(tài)自動(dòng)評(píng)估與優(yōu)化,無(wú)需人工激勵(lì)訓(xùn)練即可完成強(qiáng)化學(xué)習(xí),訓(xùn)練閉環(huán)真正內(nèi)嵌進(jìn)模型世界本身。隨著推理效率提升,GE - Sim 2.0已接近實(shí)時(shí)運(yùn)行,成為可實(shí)時(shí)交互的系統(tǒng)環(huán)境。

這一技術(shù)升級(jí)為具身智能帶來(lái)范式革新。世界動(dòng)作模型與視覺(jué) - 語(yǔ)言 - 動(dòng)作模型深度融合,讓機(jī)器人從被動(dòng)響應(yīng)環(huán)境的“反應(yīng)式控制”,轉(zhuǎn)變?yōu)槟茴A(yù)判未來(lái)、規(guī)劃全局的“生成式?jīng)Q策”。世界模擬器搭建起無(wú)限延伸的虛擬訓(xùn)練場(chǎng),機(jī)器人可在此大規(guī)模試錯(cuò)、反復(fù)優(yōu)化,不再受真實(shí)數(shù)據(jù)稀缺性束縛,其能力上限由模擬的真實(shí)度與高效性決定。當(dāng)模型成為可交互、可訓(xùn)練、可進(jìn)化的完整世界,現(xiàn)實(shí)不再是機(jī)器人唯一的訓(xùn)練場(chǎng),機(jī)器人有望徹底跳出“復(fù)現(xiàn)經(jīng)驗(yàn)”的局限,真正走向自主探索、持續(xù)進(jìn)化的新階段。

 
 
更多>同類(lèi)天脈資訊
全站最新
熱門(mén)內(nèi)容
媒體信息
新傳播周刊
新傳播,傳播新經(jīng)濟(jì)之聲!
網(wǎng)站首頁(yè)  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)隱私  |  RSS訂閱  |  違規(guī)舉報(bào) 魯公網(wǎng)安備37010202700497號(hào)