曾幾何時,波士頓動力Atlas的跑酷視頻驚艷全球,其流暢且高難度的動作,讓人們看到了人形機器人運動能力的巨大潛力。早期,機器人跳舞的展示也吸引了不少技術(shù)愛好者的目光,大家會仔細觀察機器人關(guān)節(jié)的轉(zhuǎn)動、平衡的維持,那時行業(yè)熱衷于比拼誰能做出更炫酷的極限動作。
然而,僅僅半年時間,機器人行業(yè)的風(fēng)向就發(fā)生了徹底轉(zhuǎn)變。如今打開機器人企業(yè)的新品視頻,曾經(jīng)頻繁出現(xiàn)的跑酷、跳舞場景已難覓蹤跡,取而代之的是機器人“疊衣服”的操作。Figure 03用五指手嘗試疊毛巾,即便邊角偶爾卷起也未停下;Weave Robotics的半自動疊衣視頻雖經(jīng)過2倍快進處理,看似利落,實則隱藏著真實速度偏慢的問題。谷歌ALOHA的掛衣演示未進行剪幀處理,動作緩慢,偶爾還會對不齊衣架,卻因真實而圈粉無數(shù);Dyna Robotics則讓機器人連續(xù)18小時疊餐巾,機械臂反復(fù)起落,展現(xiàn)出執(zhí)著于單一任務(wù)的勁頭。
機器人從熱衷于炫技到專注于做家務(wù),這一轉(zhuǎn)變背后是行業(yè)概念炒作的減少,企業(yè)開始重新審視并逐漸貼近市場的真實需求。那么,為何機器人企業(yè)紛紛選擇學(xué)習(xí)疊衣服呢?
機器人企業(yè)扎堆投入疊衣領(lǐng)域,關(guān)鍵在于技術(shù)與需求實現(xiàn)了精準(zhǔn)對接。十年前,機器人疊衣服還只是實驗室里的新鮮事。2010年,Willow Garage公司推出的PR2機器人,只能在固定的綠色背景下勉強疊好一件簡單襯衫,動作遲緩得讓人失去耐心,更換衣服或環(huán)境后,就大概率無法正常工作。當(dāng)時的技術(shù)完全依賴精準(zhǔn)標(biāo)定的相機和手工編寫的動作程序,演示更像是一次性的表演,根本無法實際應(yīng)用。
轉(zhuǎn)折點出現(xiàn)在機器人學(xué)習(xí)技術(shù)取得突破。擴散模型和零樣本學(xué)習(xí)成熟后,機器人無需逐一步驟編程,僅依靠幾千條人類演示數(shù)據(jù),就能自行掌握疊衣服的技巧。再加上HuggingFace、LeRobot生態(tài)系統(tǒng)以及框架的普及,技術(shù)門檻大幅降低,初創(chuàng)團隊也能借助預(yù)訓(xùn)練模型快速完成演示。例如谷歌ALOHA,僅用6000條系鞋帶的演示數(shù)據(jù),就讓機械臂學(xué)會了這一精細動作,而疊衣服的容錯率更高,數(shù)據(jù)收集也更為簡便。
更重要的是,疊衣服的需求極為剛性。“不想手動疊衣服”是許多人的心聲,甚至有人愿意為此額外付費。對于像1X Technologies這類面向家庭場景開發(fā)的機器人企業(yè)而言,相較于門檻較高的工業(yè)場景,家用疊衣場景更容易讓大眾感知到其價值,落地路徑也更為清晰。即便目前的演示尚不完美,但人們?nèi)阅軓闹锌吹轿磥恚夯蛟S不久后,真會有能包攬家務(wù)、解放雙手的機器人管家出現(xiàn)。
疊衣服的“試錯成本”較低。打翻杯子需要更換新品,組裝零件出錯要重新調(diào)試,而疊衣服失敗后,只需將衣服重新擺好便可再次嘗試。這種不易損壞設(shè)備、容錯率高的特點,使企業(yè)能夠以更低的成本打磨技術(shù)、進行演示,尤其適合資金有限的初創(chuàng)團隊。
盡管目前機器人疊衣的演示形式多樣,但冷靜分析后會發(fā)現(xiàn),現(xiàn)有技術(shù)與“讓人愿意購買”之間仍存在較大差距。在細節(jié)方面,F(xiàn)igure 03疊衣服時速度過快,導(dǎo)致邊角容易卷翹,這反映出機器人無法準(zhǔn)確感知衣物材質(zhì),也無法及時察覺受力情況。1X Technologies的Neo機器人,機械臂整理衣服的動作顯得生硬,折疊過程刻板,缺乏人類靈活調(diào)整的狀態(tài);Weave Robotics即便不進行2倍快進,很多演示的效率也遠不及人類。
在具體場景上,企業(yè)拍攝的演示大多在實驗室或固定的樣板間進行,桌面平整且為純色,衣服材質(zhì)單一,背景無任何干擾。還有些像1X Technologies Neo機器人采用遙操作方式,由人類專家遠程遙控貼衣服。然而真實的家庭環(huán)境遠非如此理想,衣服可能掉在地毯上,與襪子、內(nèi)衣混在一起,桌面堆滿雜物,光線也時明時暗。谷歌ALOHA的掛衣演示雖真實,卻暴露出“對齊難”的問題,連簡單的掛衣架都要反復(fù)調(diào)整,更別說處理皺巴巴的襯衫和易變形的毛衣了。
更為關(guān)鍵的是,企業(yè)和消費者的關(guān)注點存在差異。企業(yè)強調(diào)“機器人能疊衣服了”“實現(xiàn)零樣本折疊了”,聚焦于“能否做到”;而終端用戶更關(guān)心“能否做好”,比如是否會扯壞真絲襯衫、能否在5分鐘內(nèi)疊完一籃衣服、能否自行從洗衣籃拿取衣服并疊好后放入衣柜。目前多數(shù)演示僅完成了“折疊”這一動作,取衣、整理、收納等關(guān)鍵步驟均未涉及,這種“半成品”式的技術(shù)展示,實際上只是技術(shù)發(fā)展過程中的一個環(huán)節(jié)。
早年機器人通過跑酷、跳舞等極限動作進行演示,更多是在“秀肌肉”,以此證明自身的運動控制和平衡能力,吸引資本關(guān)注、炒熱行業(yè)熱度。在技術(shù)發(fā)展初期,這種做法確有必要。但當(dāng)行業(yè)發(fā)展到一定階段,僅靠“炫技”已無法推動商業(yè)落地,企業(yè)必須找到技術(shù)與市場的契合點。疊衣賽道的興起,正是行業(yè)從“我能做什么”向“用戶需要什么”轉(zhuǎn)變的明顯信號。
這也體現(xiàn)了人形機器人的發(fā)展邏輯:技術(shù)突破不一定要追求極限性能,能否適配實際場景更為重要。日本發(fā)那科、安川等工業(yè)機器人巨頭,能夠長期占據(jù)市場主導(dǎo)地位,核心原因在于始終圍繞工業(yè)生產(chǎn)的真實需求開展研發(fā)。他們不關(guān)注機器人“跳得好不好看”,只在意“焊接是否精準(zhǔn)”“搬運效率高不高”。人形機器人若想大規(guī)模進入市場,也應(yīng)遵循這一原則,先解決用戶的“剛需痛點”,再逐步拓展更復(fù)雜的功能。
當(dāng)然,這并不意味著行業(yè)要放棄核心技術(shù)。當(dāng)前疊衣演示所暴露的感知精度不足、操作不靈活等問題,仍需通過優(yōu)化算法、升級硬件來解決。《Science Robotics》在11月刊發(fā)的論文《Learning a thousand tasks in a day》,提出了“機械臂24小時學(xué)會1000項任務(wù)”的方向,為行業(yè)提供了新思路,即通過更高效的算法減少對數(shù)據(jù)的依賴,使機器人能夠自主學(xué)習(xí)、更好地適應(yīng)環(huán)境。未來技術(shù)成熟后,機器人或許能從“疊衣服”拓展到洗碗、擦窗、整理衣柜等更多場景,但前提是始終圍繞用戶需求展開。













