在機(jī)器人技術(shù)領(lǐng)域,如何讓機(jī)械靈巧手擁有類似人類的觸覺感知與精細(xì)操作能力,一直是科研人員攻克的重點方向。初創(chuàng)公司Sharpa憑借其創(chuàng)新性的技術(shù)路徑,為這一難題提供了全新解法,僅用一年多時間便探索出從仿真建模到分層控制的實踐路徑。
Sharpa推出的Wave靈巧手集成22個主動自由度,與人手比例達(dá)到1:1,配備高分辨率觸覺傳感器,兼具動態(tài)響應(yīng)能力與友好開發(fā)環(huán)境。這款產(chǎn)品為機(jī)器人靈巧操作及高質(zhì)量具身數(shù)據(jù)采集開辟了新可能,但隨之而來的挑戰(zhàn)同樣顯著:數(shù)據(jù)采集復(fù)雜度陡增、視覺與觸覺模態(tài)競爭加劇、計算開銷大幅上升。若選擇夾爪與純視覺技術(shù)路徑,雖能快速完成特定任務(wù)演示,卻會面臨未來范式轉(zhuǎn)移與硬件重構(gòu)的雙重困境。
面對技術(shù)瓶頸,Sharpa選擇了一條更具挑戰(zhàn)性的道路——將觸覺靈巧手作為核心工具,通過分層計算架構(gòu)解鎖新方法。其提出的"分級動作生成"策略巧妙復(fù)刻人類肌肉記憶:以"伸手取水杯"為例,系統(tǒng)先通過視覺引導(dǎo)手臂接近目標(biāo)并調(diào)整手掌姿態(tài),待接觸發(fā)生后,觸覺與本體覺立即接管控制權(quán),完成捏、轉(zhuǎn)、提等精細(xì)動作。這種"先視覺定向,后觸覺微調(diào)"的分級模式,既符合物理交互直覺,又大幅降低計算負(fù)擔(dān),使AI無需全程依賴視覺算力。
從生成式概率模型視角審視,該策略可理解為兩級條件概率漏斗的協(xié)同運作:視覺主導(dǎo)的初級漏斗負(fù)責(zé)生成粗略動作與整體意圖,觸覺主導(dǎo)的次級漏斗則結(jié)合實時手感信息生成精細(xì)動作。這種設(shè)計暗合人類神經(jīng)系統(tǒng)分級構(gòu)造,通過多級協(xié)同實現(xiàn)熵減與動作生成。基于此認(rèn)知,Sharpa構(gòu)建了由System 2、System 1、System 0組成的三重系統(tǒng)架構(gòu)。
System 2作為邏輯推理中樞,將復(fù)雜任務(wù)拆解為語義明確的子任務(wù);System 1扮演規(guī)劃師角色,結(jié)合視覺觀察輸出物理含義的粗動作軌跡;System 0則作為緊貼物理世界的執(zhí)行者,通過觸覺與本體覺反饋實現(xiàn)高頻精細(xì)控制。這種架構(gòu)設(shè)計巧妙平衡計算開銷與實時控制需求:推理頻次最高的System 0采用極小模型規(guī)模,確保100Hz級高頻反饋;規(guī)模龐大的System 2在后臺低頻運轉(zhuǎn),避免算力浪費。同時,每級系統(tǒng)設(shè)定絕對主導(dǎo)感知模態(tài),有效緩解模態(tài)沖突問題。
作為系統(tǒng)核心的System 0采用流匹配模型,以delta動作(關(guān)節(jié)角或關(guān)鍵點調(diào)節(jié)量)為輸出,通過極致簡化設(shè)計實現(xiàn)推理速度突破:模型參數(shù)壓縮至極限,流場ODE解算步驟大幅削減,觀測幀數(shù)控制在5幀以內(nèi)。這種短程、高頻的實時控制設(shè)計,使其既能與System 1協(xié)同完成自主任務(wù),也可單獨對接遙操作設(shè)備進(jìn)行數(shù)據(jù)采集。在"手內(nèi)重定向"與"雙指搓球"實驗中,接入System 0的機(jī)器手展現(xiàn)出驚人穩(wěn)定性,能自動過濾操作抖動并維持受力平衡,仿佛具備磁吸效應(yīng)。
觸覺規(guī)律的數(shù)字化建模是系統(tǒng)實現(xiàn)的關(guān)鍵突破。Sharpa團(tuán)隊在NVIDIA Isaac Sim中構(gòu)建高精度數(shù)字孿生,通過凸包技術(shù)優(yōu)化幾何計算,并開發(fā)專用插件模擬彈性體形變。實驗數(shù)據(jù)顯示,該方案接觸點誤差小于1毫米,受力誤差控制在0.5牛以內(nèi),形變重合度超85%。在強(qiáng)化學(xué)習(xí)階段,團(tuán)隊采用PPO算法訓(xùn)練教師策略,將力學(xué)常識編碼為獎懲機(jī)制,再通過策略蒸餾剝離仿真特權(quán)信息,使學(xué)生策略可直接零樣本部署至真實機(jī)械手。
這種仿真生成與真機(jī)微調(diào)相結(jié)合的閉環(huán)路徑,有效解決了具身智能落地的數(shù)據(jù)困境。預(yù)訓(xùn)練的System 0級聯(lián)遙操作設(shè)備后,數(shù)據(jù)采集效率與質(zhì)量顯著提升,還能實現(xiàn)異地人機(jī)協(xié)同;接入System 1的高層認(rèn)知模塊后,系統(tǒng)可從互聯(lián)網(wǎng)視頻中提取任務(wù)規(guī)律,形成完整的控制閉環(huán)。面對Sim2Real挑戰(zhàn),高保真物理建模與生成式AI的閉環(huán)魯棒性構(gòu)成雙重保障:前者基于硬件特性針對性建模實現(xiàn)零樣本遷移,后者通過概率生成機(jī)制持續(xù)響應(yīng)誤差,自然消化部分仿真到現(xiàn)實的偏差。






















