在機(jī)器人產(chǎn)業(yè)邁向?qū)嵱没倪M(jìn)程中,具身智能領(lǐng)域正面臨一場關(guān)于數(shù)據(jù)積累的激烈競爭。行業(yè)專家普遍認(rèn)為,機(jī)器人能否真正實(shí)現(xiàn)產(chǎn)業(yè)化,關(guān)鍵在于其"大腦"的決策能力,而這一能力的突破離不開海量真實(shí)場景數(shù)據(jù)的支撐。當(dāng)前,具身智能領(lǐng)域正經(jīng)歷著前所未有的發(fā)展熱潮,但數(shù)據(jù)短缺已成為制約行業(yè)發(fā)展的核心瓶頸。
據(jù)行業(yè)數(shù)據(jù)顯示,訓(xùn)練達(dá)到ChatGPT-5級別系統(tǒng)所需的語料規(guī)模達(dá)百億小時(shí),而具身智能領(lǐng)域目前可用的數(shù)據(jù)量僅約50萬小時(shí),存在兩個(gè)數(shù)量級的差距。更嚴(yán)峻的是,現(xiàn)有數(shù)據(jù)還存在標(biāo)準(zhǔn)不統(tǒng)一、質(zhì)量參差不齊、供需不匹配等問題。京東方面指出,要使具身智能達(dá)到真正可用的水平,至少需要1000萬小時(shí)級別的真實(shí)場景交互數(shù)據(jù),而當(dāng)前行業(yè)整體數(shù)據(jù)規(guī)模僅約100萬小時(shí),缺口高達(dá)十倍。
數(shù)據(jù)獲取的困難主要體現(xiàn)在三個(gè)方面:首先是真實(shí)場景交互數(shù)據(jù)的獲取成本高昂,傳統(tǒng)物理AI數(shù)據(jù)采集需要定制化機(jī)械臂、專用傳感器等設(shè)備,部署周期長且成本高企;其次是模型泛化能力不足,難以適應(yīng)不同環(huán)境和任務(wù)場景的需求;最后是數(shù)據(jù)孤島現(xiàn)象嚴(yán)重,不同機(jī)器人本體的數(shù)據(jù)無法實(shí)現(xiàn)互通復(fù)用。這些挑戰(zhàn)共同構(gòu)成了具身智能發(fā)展的"數(shù)據(jù)荒漠"困境。
面對這一挑戰(zhàn),行業(yè)領(lǐng)軍企業(yè)正在積極布局?jǐn)?shù)據(jù)基建。京東近日宣布推出自研的可穿戴式超高清采集終端JoyEgoCam,該設(shè)備配備4K高清攝像頭,支持60幀幀率與130度超廣角拍攝,能夠?qū)崿F(xiàn)毫秒級動(dòng)作細(xì)節(jié)捕捉,重投影誤差小于0.2像素。同時(shí),京東還發(fā)布了具身大模型JoyAI-RA和具身智能數(shù)據(jù)交易平臺(tái),并率先公開了2000小時(shí)人類實(shí)操視頻數(shù)據(jù)集。
另一家新興企業(yè)覓蜂科技也推出了MEgo系列無本體數(shù)據(jù)采集硬件,包括采集夾爪、頭戴式采集設(shè)備等,具備超300度全景感知與亞毫秒級數(shù)據(jù)同步能力。這些可穿戴設(shè)備的出現(xiàn),使得普通人也能在工廠、物流、零售、醫(yī)療等場景中完成數(shù)據(jù)采集工作,大大降低了數(shù)據(jù)獲取門檻,拓展了數(shù)據(jù)采集的邊界。
在數(shù)據(jù)采集規(guī)模上,京東已經(jīng)發(fā)動(dòng)內(nèi)部超過10萬名員工和外部最多50萬名各行業(yè)人員參與數(shù)據(jù)采集工作,僅在宿遷地區(qū)就計(jì)劃動(dòng)員超10萬市民參與。公司計(jì)劃在未來兩年內(nèi)構(gòu)建全球規(guī)模最大的具身智能數(shù)據(jù)采集中心,積累1000萬小時(shí)人類真實(shí)場景視頻數(shù)據(jù)。覓蜂科技則預(yù)計(jì)今年數(shù)據(jù)采集規(guī)模將達(dá)到千萬小時(shí)級別,其官網(wǎng)"數(shù)據(jù)市場"板塊已上架467個(gè)具身智能訓(xùn)練數(shù)據(jù)產(chǎn)品。
數(shù)據(jù)采集只是第一步,如何將這些數(shù)據(jù)轉(zhuǎn)化為機(jī)器人的"大腦"能力同樣關(guān)鍵。京東為此建立了完整的數(shù)據(jù)處理鏈條:底層硬件采集的物理世界數(shù)據(jù),首先進(jìn)入"工具層"進(jìn)行數(shù)據(jù)處理、模型訓(xùn)練和仿真評測;然后進(jìn)入模型層,通過VLA模型(視覺-語言-動(dòng)作模型)、VLN模型(視覺-語言導(dǎo)航)等核心技術(shù)構(gòu)建機(jī)器人的決策能力;最終在應(yīng)用層實(shí)現(xiàn)技術(shù)落地,覆蓋家政服務(wù)、物流配送、醫(yī)療輔助等多個(gè)領(lǐng)域。
在服務(wù)保障方面,京東創(chuàng)新性地推出了"機(jī)器人救護(hù)車"服務(wù),為人形機(jī)器人、四足機(jī)器人等提供維修保養(yǎng)、故障診斷、換電補(bǔ)能等全場景服務(wù)。該服務(wù)已在北京地區(qū)率先落地,未來三年計(jì)劃擴(kuò)展至全國50個(gè)以上核心城市。同時(shí),京東還宣布將打通線上App、線下門店和海外平臺(tái)等全渠道銷售網(wǎng)絡(luò),目標(biāo)在2026年助推機(jī)器人品牌累計(jì)銷售規(guī)模突破百億元,并將產(chǎn)品上市周期縮短20%。
這場關(guān)于具身智能的數(shù)據(jù)基建競賽正在全面展開。從數(shù)據(jù)采集硬件的創(chuàng)新,到數(shù)據(jù)處理平臺(tái)的搭建,再到應(yīng)用場景的拓展,行業(yè)正在構(gòu)建完整的數(shù)據(jù)生態(tài)鏈。誰能在數(shù)據(jù)積累和模型訓(xùn)練上占據(jù)先機(jī),誰就更有可能在機(jī)器人智能化競爭中脫穎而出,引領(lǐng)下一個(gè)十年的產(chǎn)業(yè)發(fā)展方向。













