阿里巴巴千問團隊近日正式發布了一款面向編碼代理與本地開發場景的開放權重語言模型——Qwen3-Coder-Next。該模型通過創新架構與訓練方法,在編程能力與推理效率之間實現了突破性平衡,為開發者提供了更高效的智能編程工具。
基于Qwen3-Next-80B-A3B-Base架構,研發團隊采用混合注意力機制與MoE(專家混合)架構,構建了新一代智能編程模型。通過大規模可執行任務合成、環境交互反饋與強化學習技術,模型在降低推理成本的同時,顯著提升了代碼生成與智能體交互能力。訓練過程中突破傳統參數擴展模式,重點強化智能體訓練信號的擴展性,采用四階段優化策略:首先在代碼與智能體數據集上進行持續預訓練,隨后通過高質量智能體軌跡數據監督微調,接著針對軟件工程、QA、Web/UX等領域開展專家訓練,最終將多領域能力蒸餾至單一可部署模型。
在編程智能體基準測試中,該模型展現出強勁競爭力。使用SWE-Agent框架時,在SWE-Bench Verified基準上取得超過70%的準確率,在多語言環境及更具挑戰性的SWE-Bench-Pro測試中保持領先。特別值得注意的是,盡管激活參數規模僅為3B,其性能已可媲美參數量高10-20倍的開源模型,在TerminalBench 2.0和Aider等基準測試中同樣表現優異。
效率與性能的平衡優化成為該模型的核心優勢。測試數據顯示,在SWE-Bench-Pro基準上,3B激活參數的Qwen3-Coder-Next與參數量大數十倍的模型性能相當,在低成本智能體部署場景中占據帕累托前沿。這種突破得益于訓練方法對長程推理、工具使用和錯誤恢復能力的針對性強化,使模型更適應真實開發環境中的復雜需求。
目前,該模型已通過ModelScope和Hugging Face平臺開放下載,開發者可自由獲取模型權重進行本地部署與二次開發。研發團隊表示,后續將持續優化模型的推理決策能力,擴展任務支持范圍,并根據用戶反饋快速迭代更新,為智能編程領域提供更強大的技術支撐。












