在具身智能領(lǐng)域,一場圍繞數(shù)據(jù)供給能力的競爭正悄然升級。盡管資本不斷涌入,但行業(yè)普遍面臨“能執(zhí)行卻不智能”的困境,其根源在于高質(zhì)量訓練數(shù)據(jù)的嚴重短缺。據(jù)統(tǒng)計,全球可用的具身數(shù)據(jù)總量僅約五十萬小時,與大語言模型訓練所需的語料規(guī)模相差萬倍以上。這種差距催生了全新的數(shù)據(jù)基礎(chǔ)設(shè)施市場,多家企業(yè)紛紛布局,試圖在這片藍海中占據(jù)先機。
四月十六日,智元機器人旗下的覓蜂科技宣布推出一站式物理AI數(shù)據(jù)服務平臺,正式以“數(shù)據(jù)賣鏟人”的角色切入市場。該公司CEO姚卯青在發(fā)布會上透露,國內(nèi)真機數(shù)據(jù)采集的價格已飆升至每小時五百至一千元,需求端處于“有多少買多少”的緊缺狀態(tài)。為緩解供給瓶頸,覓蜂科技推出了覆蓋真機遙操作、無本體采集與仿真數(shù)據(jù)的全范式平臺,并同步發(fā)布了MEgo系列采集硬件,包括專用夾爪和頭戴式設(shè)備。按照規(guī)劃,該企業(yè)將在年內(nèi)實現(xiàn)千萬小時級的數(shù)據(jù)產(chǎn)能,并計劃到2030年將規(guī)模擴大至百億小時。
針對外界對覓蜂科技獨立性的質(zhì)疑,姚卯青強調(diào),盡管公司脫胎于智元機器人,但運營完全獨立。智元機器人獲取數(shù)據(jù)需通過市場渠道,與其他客戶遵循相同的商業(yè)條款。這一安排旨在消除同行對數(shù)據(jù)命脈被壟斷的顧慮,為行業(yè)合作創(chuàng)造公平環(huán)境。
大廠的入場進一步加速了數(shù)據(jù)基建的規(guī)模化進程。同日,京東展示了其具身智能數(shù)據(jù)體系,覆蓋采集、存儲、標注、訓練、評測、仿真與測試全鏈條。依托遍布全國的倉儲物流網(wǎng)絡(luò)和多元線下場景,京東構(gòu)建了真實環(huán)境下的數(shù)據(jù)護城河。戴盟機器人則發(fā)布了包含觸覺信息的全模態(tài)數(shù)據(jù)集Daimon-Infinity,預計年內(nèi)規(guī)模將達數(shù)百萬小時,并率先在阿里魔搭開源一萬小時數(shù)據(jù)。百度智能云也在月初聯(lián)合多家企業(yè)推出了“具身智能數(shù)據(jù)超市”,進一步豐富了市場供給。
然而,數(shù)據(jù)質(zhì)量仍是行業(yè)面臨的核心挑戰(zhàn)。布米普特拉北京投資基金管理有限公司的分析師指出,超過九成的采集數(shù)據(jù)因重復、噪聲或缺乏物理反饋而難以直接使用。真正稀缺的并非原始數(shù)據(jù)量,而是高價值數(shù)據(jù)的精煉與閉環(huán)迭代能力。隨著數(shù)據(jù)基礎(chǔ)設(shè)施逐漸成為具身智能的底層命脈,誰能率先建立高質(zhì)量數(shù)據(jù)供給體系并掌握生態(tài)主導權(quán),誰就能在這場萬億賽道的競爭中脫穎而出。這場圍繞數(shù)據(jù)定義權(quán)的競逐,才剛剛拉開帷幕。





















