小米科技近日宣布,其MiMo-V2.5系列API將實施永久性價格下調,最高降幅達到99%,且不再對上下文窗口長度進行差異化定價。這一調整于北京時間5月27日零時起全球同步生效,旨在為開發者提供更具性價比的AI服務。與此同時,Token Plan計費體系也迎來重大升級,用戶可獲得的Token用量將提升至原有水平的5至8倍,計費規則亦更加透明簡化。
根據官方公告,所有當前有效訂閱Token Plan的用戶(包括通過百萬億Token創造者激勵計劃及Apache軟件基金會專屬福利獲得權益的用戶),其Credits額度將于調價生效時自動重置,并按照新規則執行。對于歷史付費但已過期的用戶,小米承諾將在未來一周內公布額外福利方案,進一步擴大優惠覆蓋范圍。
此次價格策略調整的背后,是小米技術團隊在推理系統架構上的突破性優化。通過重構KV Cache在GPU顯存、CPU內存與SSD之間的數據調度機制,數據搬運量較優化前減少近86%,可緩存Token數量則擴大至原來的5倍。團隊還通過改進專家并行計算方案與輸入長度動態分桶策略,顯著提升了集群整體吞吐能力,從而在確保服務質量的前提下實現單位Token成本持續下降。
行業分析指出,小米此次API降價與計費體系改革,不僅降低了AI開發者的使用門檻,更通過技術優化形成的成本優勢,為全球AI生態建設注入新動力。特別是對于需要處理長文本或高頻調用API的場景,新方案將帶來顯著的經濟效益提升。






















