小米技術團隊近日宣布,正式推出全新的一步式潛空間語言視覺推理框架——Xiaomi OneVL。這一創新成果標志著小米在人工智能領域的技術探索邁出了重要一步,同時團隊宣布將該模型的權重、訓練及推理代碼全面開源,供全球開發者與研究人員共同參與完善。
據介紹,Xiaomi OneVL是小米繼今年早些時候發布XLA認知大模型架構后的又一技術突破。該框架通過潛空間推理技術,首次將視覺語言動作(VLA)、世界模型以及潛空間推理三大主流技術路線整合至同一體系,實現了多模態信息的高效協同處理。這一設計不僅簡化了傳統多任務模型的復雜度,還顯著提升了推理效率與準確性。
小米董事長雷軍在社交平臺表示,Xiaomi OneVL在推理、規劃等核心基準測試中表現優異,多項指標刷新了潛在推理方法的性能紀錄。他強調,開源的目的是吸引全球開發者共同探索自動駕駛等領域的創新應用,推動技術邊界的拓展。目前,相關代碼與模型權重已通過開放平臺發布,供學術界與產業界自由使用與改進。




















