在博鰲亞洲論壇2026年年會的人形機器人專題論壇上,百度智能云數(shù)字發(fā)言人ViviDora以特邀嘉賓身份亮相,通過實時互動完成會議介紹與問答環(huán)節(jié)。這一基于高擬真數(shù)字人技術和文心大模型打造的虛擬形象,展現(xiàn)了從"可展示"向"可服務"進化的技術突破。相較于傳統(tǒng)虛擬形象,ViviDora在形象真實度、語義理解能力和交互響應速度上均有顯著提升,其現(xiàn)場表現(xiàn)引發(fā)與會者對人機交互新形態(tài)的深入探討。
百度集團執(zhí)行副總裁沈抖在主題演講中指出,具身智能產業(yè)發(fā)展面臨三大核心挑戰(zhàn):硬件本體的規(guī)模化量產、多模態(tài)數(shù)據(jù)的獲取與處理、復雜場景模型的泛化能力。他特別強調,中國制造業(yè)完整的供應鏈體系、龐大的工程師隊伍以及領先的場景落地能力,為突破這些瓶頸提供了獨特優(yōu)勢。據(jù)透露,百度智能云依托"芯云模體"全棧技術架構,已在具身智能云服務市場占據(jù)主導地位,為智元機器人、宇樹科技等30余家產業(yè)鏈企業(yè)提供技術支持。
針對行業(yè)關注的成本問題,沈抖提出創(chuàng)新性觀點:隨著技術迭代,未來服務機器人可能采用類似云計算的"Token計費"模式,大幅降低使用門檻。這種商業(yè)模式變革將推動具身智能從工業(yè)領域向消費市場滲透,預計五年內家庭服務機器人成本將降至普通消費者可接受范圍。百度內部測算顯示,通過全棧技術優(yōu)化,其智能云服務可使機器人開發(fā)周期縮短40%,綜合成本降低35%。
技術展示環(huán)節(jié),ViviDora現(xiàn)場演示了多輪對話、情感識別和跨模態(tài)交互能力。當被問及"如何看待機器人倫理問題"時,該數(shù)字人不僅給出了結構化回答,還能根據(jù)提問者的表情調整回應語氣。百度工程師介紹,這種能力源于文心大模型對海量對話數(shù)據(jù)的深度學習,結合實時語音情感分析技術,使數(shù)字人具備更自然的人際交往特征。目前該技術已應用于金融客服、教育輔導等多個場景,日均處理交互請求超千萬次。






















