雷軍宣布小米AI成果入選ICLR 2026 涵蓋多領域創新突破

   時間:2026-02-03 13:08 來源:天脈網作者:鐘景軒

小米科研團隊在人工智能領域再傳捷報,其多篇最新研究成果成功入選國際頂級學術會議ICLR 2026。此次入選的研究覆蓋多模態推理、強化學習、GUI智能體、端到端自動駕駛及音頻生成等前沿方向,展現了該團隊在人工智能理論創新與應用實踐中的深厚積累。

在強化學習領域,團隊提出的《Shuffle-R1》框架通過動態數據重組技術破解了多模態大模型訓練中的兩大核心難題——優勢坍縮與軌跡沉默。該研究創新性地采用成對軌跡采樣與優勢值批次重排序機制,在保持極低計算開銷的同時,顯著提升了梯度信號質量。實驗數據顯示,該框架在多個基準測試中超越現有強化學習基線,為復雜場景下的智能決策提供了新范式。

移動智能體方向的研究同樣取得突破性進展。團隊開發的《MobileIPL》系統首創迭代偏好學習框架,通過Thinking-level DPO技術實現思考步驟的細粒度優化。結合三階段指令演化機制,該系統成功突破高質量軌跡數據稀缺的瓶頸,在AITZ等主流GUI智能體測試中刷新性能紀錄,同時在分布外場景中展現出更強的魯棒性。

端到端自動駕駛領域,團隊提出的《ReCogDrive》方案實現了多技術融合創新。該研究通過分層認知數據流水線注入駕駛先驗知識,利用認知引導擴散規劃器生成物理可行軌跡,并首創DiffGRPO強化學習算法直接優化駕駛策略。閉環測試結果表明,該方案在NAVSIM與Bench2Drive等平臺上的表現全面領先現有技術。

其他創新成果同樣引人注目:《ThinkOmni》研究實現了文本推理能力向全模態的零成本遷移;《Flow2GAN》通過融合流匹配與對抗生成技術,在音頻合成領域達成高保真少步生成;《WorldSplat》則突破4D駕駛場景生成技術,為自動駕駛仿真訓練提供更真實的虛擬環境。這些成果標志著小米在人工智能基礎研究領域已形成系統性布局。

 
 
更多>同類天脈資訊
全站最新
熱門內容
媒體信息
新傳播周刊
新傳播,傳播新經濟之聲!
網站首頁  |  關于我們  |  聯系方式  |  版權隱私  |  RSS訂閱  |  違規舉報 魯公網安備37010202700497號