在人工智能領域,世界模型正成為新的焦點。隨著技術發展,具身智能行業迎來關鍵轉折點,傳統視覺-語言-動作模型(VLA)的局限性逐漸顯現,而世界模型正以獨特優勢嶄露頭角。英偉達在GTC大會上提出Physical AI概念,預測工業與機器人市場規模可達50萬億美元;紅杉AI峰會上,英偉達機器人負責人Jim Fan更直言行業重心正從VLA轉向世界動作模型(World Action Models)。這些動向表明,讓AI真正理解物理世界已成為技術演進的核心方向。
VLA技術雖在分揀、倉儲搬運等結構化場景中驗證了價值,但其數據依賴性強、泛化能力不足、缺乏記憶機制等問題在復雜場景中愈發突出。例如,當物體、光照或布局發生變化時,模型往往需要重新采集數據;面對物理因果關系和長期后果預測時,穩定性難以保證;任務完成后也難以沉淀經驗。這些問題促使行業重新思考:機器人僅能"看懂指令"遠遠不夠,更需要具備理解世界運行規律、預測行動后果、持續修正認知的能力。
世界模型的價值正體現在此。它通過內部推演機制,讓機器人在行動前模擬不同選擇的結果:抓取杯子是否會傾倒?前行路線是否被障礙物阻擋?先開柜門再取物是否更高效?這種能力與人類過馬路時的判斷邏輯相似——無需精確計算所有變量,僅憑對世界運行規律的認知就能做出合理決策。這種心智模型的形成,正是當前具身智能突破的關鍵。
具腦磐石公司正沿著這條路徑展開技術攻關。創始人朱森華將世界模型的技術路線拆解為五層架構:第一層視覺真實解決3D空間理解問題;第二層物理真實建模重力、摩擦等物理規律;第三層交互真實通過仿真強化學習積累經驗;第四層抽象表征采用JEPA架構減少像素級依賴;第五層主動推理引入認知神經科學理論,實現"假設-預測-行動-修正"的閉環。這種分層設計既覆蓋了從感知到認知的全鏈條,又突出了類腦智能的核心特征。
與純學術研究不同,具腦磐石的技術路線具有鮮明的工程化導向。其認知世界模型在JEPA架構基礎上,增加了感知、規劃、行動、反饋等完整鏈路,形成面向具身落地的增強版解決方案。公司重點攻關四個方向:多模態感知編解碼機制提升環境理解效率;動態預測機制模擬物理交互后果;終身學習機制實現經驗沉淀;稀疏計算架構滿足端側部署需求。這些技術突破最終指向四個關鍵指標:低數據依賴、高場景泛化、持續學習能力、低功耗運行。
這家成立于2025年的公司,近日完成億元級融資,由具備類腦與具身產業背景的頂尖資本領投。投資方看重的不僅是世界模型的熱度,更是團隊獨特的復合背景:創始人朱森華兼具認知神經科學博士背景與華為云AI算法創新Lab主任的產業經驗;聯合創始人劉晉宇則帶來AI機器人產品化與全球商業化的實戰經驗。核心團隊覆蓋清華、北大等頂尖院校,以及華為、曠視等頭部企業,形成從理論研究到工程落地的完整能力鏈。
在商業化路徑上,具腦磐石采取"模塊復用+場景閉環"策略。公司優先開發具身技能學習、認知導航等可復用模塊,通過真實場景驗證形成數據與現金流閉環。目前已在國內外推進多個行業客戶概念驗證(PoC),并簽約多家戰略合作伙伴。產品規劃上,公司提出"一腦多機、一腦多形"的演進路線:短期實現多機協作,中期探索單一模型適配不同本體,長期向行業開放通用具身大腦。這種務實策略既降低了技術落地門檻,又為持續迭代提供了數據支撐。























