在北京國家會議中心舉辦的百度AI開發者大會Create 2026具身智能專題論壇上,來自全球頂尖高校、科研機構及行業龍頭企業的技術專家齊聚一堂,圍繞具身智能的技術突破與產業落地展開深度探討。這場由百度智能云與機器人大講堂聯合主辦的活動,吸引了包括北京大學、上海交通大學、英偉達等在內的多方力量參與,共同繪制具身智能從實驗室走向真實場景的路線圖。
百度集團副總裁袁佛玉在開幕致辭中指出,全球AI產業正經歷從數字世界向物理世界滲透的關鍵轉折。過去兩年大模型重塑了文本、圖像等數字領域,而當前核心命題已轉向如何讓AI在物理環境中實現安全、可靠、低成本的行動。她強調,具身智能不是單一技術突破,而是涉及模型、數據、硬件、芯片等全鏈條的系統工程,需要構建"知行合一"的技術體系。百度智能云將從夯實基礎設施、深化場景鏈接、推動標準建設三大維度發力,目前已助力啟元研究院、星動紀元等企業開展具身模型研發。
在技術路徑探討環節,星動紀元創始人陳建宇提出"全棧系統驅動規模化"理念。他指出,人形機器人要實現從可用到可規模化的跨越,必須構建覆蓋數據、大腦、本體、應用四層的閉環體系。其團隊構建的五級數據金字塔中,真機數據被視為最高質量資源,而長尾故障數據的價值遠超常規成功數據。在硬件層面,星動紀元堅持核心部件全棧自研,重點突破五指靈巧手技術,為規模化落地奠定硬件基礎。
智平方合伙人張鵬展示了VLA范式的進化方向。其自研的NeuroVLA模型通過類腦計算與VLA深度融合,突破了傳統模型響應延遲高、推理能力弱的瓶頸,實現毫秒級實時響應。更值得關注的是,智平方聯合百度智能云開源的AlphaBrain Platform,向行業開放模型、測評工具及數據服務,旨在降低研發門檻,推動技術普惠。張鵬強調,具身智能落地需要AI、硬件、場景三要素深度融合,構建完整的商業閉環與數據閉環。
浙江大學熊蓉教授提出的SPIRE知行融貫體系引發關注。該體系通過"大腦+小腦"分層架構,精準破解視覺語言模型識別不準、物理交互薄弱等痛點。在工業場景中,其團隊研發的機器人已實現亞毫米級操作精度,與杰克科技簽訂的2000臺訂單標志著全球服裝業首個批量化落地項目。家庭場景中,與方太聯合發布的機器人總廚可完成烹飪輔助,康養場景則實現了喂飯、陪護等服務。
硬件與基礎設施的創新同樣成為焦點。百度智能云主任架構師應茹介紹,百舸AI Infra已升級為具身智能專屬全棧平臺,覆蓋數據準備、訓練、評測到部署的全鏈路。針對行業三大研發范式,平臺提供5B-20B模型并行訓練方案,優化運動控制策略的通信效率,支持一鍵擴展至128卡集群。目前,該平臺已服務30余家具身企業完成模型落地。
英偉達解決方案架構師王宇杰展示了Physical AI Data Factory Blueprint,通過自動化數據生成流程幫助開發者擴展數據集規模。其Cosmos世界模型在合成數據生成、視覺推理等環節展現優勢,與Isaac GR00T N系列模型形成的完整產品棧,已在百度智能云上線支持企業開發。
論壇壓軸環節的圓桌討論匯聚了上海交通大學穆堯教授、大曉機器人周泉副總裁等學界業界代表。與會專家形成共識:2026年將成為具身智能落地元年,技術路線正從多元分散走向收斂,應用場景從試點轉向規模化。針對數據稀缺痛點,穆堯提出云端通用推理搭配輕量動作模型的解決方案;周泉則強調世界模型對提升長程任務泛化能力的重要性。在硬件形態方面,多數專家認為仿人構型將成為終極方向,但需分階段實現技術積累。
作為論壇重要成果,北京人形機器人創新中心聯合百度智能云啟動的首屆具身智能黑客松大賽備受矚目。賽事設立運動控制、VLA模型微調兩大賽道,開放天工系列機器人硬件及40萬條RoboMIND數據集等資源。評審團由高校專家與企業技術領袖組成,獲獎團隊將獲得獎金、算力資源及生態扶持。這種"以賽促研"的模式,被視為加速技術轉化、培育產業生態的重要舉措。























