成人美女黄网站免费|哔哩哔哩免费观看在线视频|freexx老女人|欧美精品三区|近的2019中文字幕在线|97中文字幕一区二区|日本jazz护士

巨人財經 - 專業科技行業財經媒體

阿里通義千問Qwen3.7系列發布:躋身全球前十五,國產大模型綜合實力領跑

   發布時間:2026-05-21 00:25 作者:鄭佳

在近期舉辦的阿里云峰會上,阿里巴巴集團副總裁、阿里云智能CTO周靖人宣布,通義千問Qwen3.7系列大模型正式面世。其中,旗艦版Qwen3.7-Max被定位為“全能智能體基座”,在編程、推理、工具調用等核心能力上實現了顯著突破,并在多項國際權威評測中刷新國產大模型紀錄,成為全球科技界關注的焦點。

在綜合性能方面,Qwen3.7-Max表現尤為突出。根據Arena AI全球大模型文本總榜最新數據,該模型以第13名的成績躋身國際頂尖行列,超越Gemini 3 Flash、GPT-5.5等國際知名模型,成為榜單前15名中唯一的中國大模型。細分領域中,其數學能力位列全球第7,編程能力排名第10,在專家級應用、軟件及IT領域均取得第9名的佳績。Qwen3.7-Plus預覽版在視覺總榜中排名第16,推動阿里實驗室整體視覺能力躍升至全球第5,展現出多模態技術的全面進步。

在知識與邏輯推理等主流評測中,Qwen3.7系列同樣展現強勁實力。對比國內及國際最新模型,如Kimi K2.6、智譜GLM5.1、DeepSeek V4 Pro等,Qwen3.7在多項測試中全面領先,穩居國內第一。這一成績不僅驗證了模型在基礎能力上的扎實積累,更凸顯其在復雜場景下的適應性優勢。

工具調用與編程能力的升級是本次發布的核心亮點。Qwen3.7的編程智能體已支持復雜工程開發,在TerminalBench 2.0測試中取得69.7分,超越DS-V4-ProMax的67.9分;在SWE-Pro和SciCode等編程基準測試中,分別以60.6分和53.5分的成績領先同類模型。更引人注目的是,在一項持續35小時、涉及超1000次工具調用的長周期實驗中,Qwen3.7始終保持穩定推理能力,成功實現端到端任務閉環,為自動化流程提供了可靠技術支撐。在辦公場景中,該模型在SpreadsheetBench-V1測試中以87.0分的高分,展現出行業頂尖的表格處理與自動化水平。

 
 
更多>同類內容
全站最新
熱門內容
本欄最新