阿里通義千問Qwen3.7系列發布：躋身全球前十五，國產大模型綜合實力領跑

發布時間：2026-05-21 00:25 來源：快訊作者：鄭佳

在近期舉辦的阿里云峰會上，阿里巴巴集團副總裁、阿里云智能CTO周靖人宣布，通義千問Qwen3.7系列大模型正式面世。其中，旗艦版Qwen3.7-Max被定位為“全能智能體基座”，在編程、推理、工具調用等核心能力上實現了顯著突破，并在多項國際權威評測中刷新國產大模型紀錄，成為全球科技界關注的焦點。

在綜合性能方面，Qwen3.7-Max表現尤為突出。根據Arena AI全球大模型文本總榜最新數據，該模型以第13名的成績躋身國際頂尖行列，超越Gemini 3 Flash、GPT-5.5等國際知名模型，成為榜單前15名中唯一的中國大模型。細分領域中，其數學能力位列全球第7，編程能力排名第10，在專家級應用、軟件及IT領域均取得第9名的佳績。Qwen3.7-Plus預覽版在視覺總榜中排名第16，推動阿里實驗室整體視覺能力躍升至全球第5，展現出多模態技術的全面進步。

在知識與邏輯推理等主流評測中，Qwen3.7系列同樣展現強勁實力。對比國內及國際最新模型，如Kimi K2.6、智譜GLM5.1、DeepSeek V4 Pro等，Qwen3.7在多項測試中全面領先，穩居國內第一。這一成績不僅驗證了模型在基礎能力上的扎實積累，更凸顯其在復雜場景下的適應性優勢。

工具調用與編程能力的升級是本次發布的核心亮點。Qwen3.7的編程智能體已支持復雜工程開發，在TerminalBench 2.0測試中取得69.7分，超越DS-V4-ProMax的67.9分；在SWE-Pro和SciCode等編程基準測試中，分別以60.6分和53.5分的成績領先同類模型。更引人注目的是，在一項持續35小時、涉及超1000次工具調用的長周期實驗中，Qwen3.7始終保持穩定推理能力，成功實現端到端任務閉環，為自動化流程提供了可靠技術支撐。在辦公場景中，該模型在SpreadsheetBench-V1測試中以87.0分的高分，展現出行業頂尖的表格處理與自動化水平。

更多>同類內容