上海創智學院與智元機器人具身研究中心近日聯合發布了一項重要成果——自主研發的τ?0WM具身世界模型。這一開源模型旨在為機器人賦予“通用大腦”,使其既能預演未來場景,又能精準執行任務,從而推動機器人向“全能伙伴”的目標邁進。
該模型的核心創新在于同步訓練機器人的“身體”與“想象力”。通過“動作條件世界模型”,機器人能根據當前畫面和動作方案生成未來場景,如同內置快速仿真器。面對同一任務,它會推演多種完成方式,模擬每種方案的結果,最終選擇最穩定、最成功的動作執行。這種能力使機器人在操作時既能“知其然”,又能“知其所以然”。
在收納羽毛球的任務測試中,τ?0WM展現了顯著優勢。未預訓練的模型需要超1000條高質量數據才能完成任務,而τ?0WM僅需400條數據即可實現精準操作。即使光照、背景或羽毛球位置發生變化,其成功率仍保持穩定。更關鍵的是,該模型具備極強的抗干擾能力——當物體被碰歪或出現意外干擾時,機器人能自動調整策略,確保任務完成。
跨平臺部署能力是τ?0WM的另一大亮點。研發團隊在3種不同構型的機器人上測試了整理工具箱、裝書包、安裝水管等4項精細操作任務,結果顯示其成功率均優于其他具身基準模型。這些任務涉及夾取、力量控制等復雜動作,例如拉開書包拉鏈、擰緊水管接頭等,充分驗證了模型的通用性和適應性。
據上海創智學院全職導師羅劍嵐介紹,τ?0WM可根據端側算力、任務難度和推理速度動態調整候選軌跡數量和推演步數,在執行效率與推理時間之間實現平衡。這種靈活性使其能適配不同場景需求,從工業生產線到家庭服務領域均具備應用潛力。
作為零號版本,τ?0WM標志著具身智能技術探索的新起點。研發團隊計劃以此為基礎,逐步開發動作模型、閉環學習系統和更大規模的具身基礎模型。隨著版本迭代,模型能力將持續提升,為機器人技術路線提供更多可能性。






















