時事快聞

阿里開源Qwen3.5小尺寸模型系列，性能亮眼引馬斯克關注與網(wǎng)友熱議

時間：2026-03-03 15:50 來源：天脈網(wǎng)作者：顧雨柔

阿里近日宣布開源Qwen3.5系列中的四款小尺寸模型，包括Qwen3.5-0.8B、Qwen3.5-2B、Qwen3.5-4B和Qwen3.5-9B。這些模型專為筆記本電腦等端側設備設計，支持在消費級顯卡上運行，并允許通過LoRA或全量微調(diào)進行任務適配。

在性能評測中，Qwen3.5-9B在多項基準測試中表現(xiàn)突出，尤其在GPQA Diamond、MMMU-Pro、ERQA和Video-MME等任務中超越了GPT-OSS-20B、GPT-5 nano和Gemini 2.5 Flash-Lite等競品。盡管Qwen3.5-4B作為更小版本，在多語言知識、視覺推理和文檔理解等任務上接近9B版本的水平，但在純數(shù)學推理方面仍有提升空間。

開發(fā)者社區(qū)對這批模型的發(fā)布反應熱烈。一位開發(fā)者指出，Qwen3.5-9B在MMMU-Pro測試中以13分優(yōu)勢擊敗GPT-5-Nano，證明架構設計比參數(shù)規(guī)模更重要。另一位開發(fā)者分享了實際使用體驗：在Mac mini上運行Qwen3.5-9B，結合OpenClaw工具，可構建成本低于初級員工月薪的AI系統(tǒng)。還有用戶通過AMD Ryzen AI Max+395處理器和Q4_K_XL量化算法，實現(xiàn)了約30個token/s的處理速度，且顯存占用不足16GB。

不同版本模型針對特定場景優(yōu)化：0.8B和2B版本以輕量化見長，適合移動設備和低延遲交互場景；4B版本作為多模態(tài)基座模型，可平衡性能與資源消耗；9B版本則在緊湊結構下實現(xiàn)接近GPT-OSS-120B的性能，成為服務器端高性價比選擇。所有模型均采用Apache 2.0協(xié)議開源，基座模型也同步開放。

社區(qū)討論中，有用戶提出Qwen3.5系列可在手機端運行，引發(fā)關于iPhone部署方案的追問。不過也有開發(fā)者客觀指出，4B模型在復雜推理任務中正確率不足50%，數(shù)學測試正確率僅約15%，更適合作為自動補全工具而非深度思考伙伴。盡管存在局限，但這些小尺寸模型在特定能力維度已達到Gemini 3 Flash等云端模型的水平，具備實際端側應用價值。

目前Qwen3.5家族已形成完整產(chǎn)品線，包含1個397B參數(shù)的大尺寸模型、3個中型模型（122B、35B、27B）和4個新發(fā)布的小尺寸模型。開發(fā)者可通過魔搭社區(qū)和Hugging Face平臺獲取相關資源。

更多>同類天脈資訊

2025理財子成績單：信銀等三公司入兩萬億梯隊農(nóng)銀凈利潤增超九成

04-05

優(yōu)必選2025財報：人形機器人成收入主力，商業(yè)化驗證仍待破局

這意味著，一個關鍵變化已經(jīng)發(fā)生，人形機器人不再只是展示性的技術，而開始成為可以帶來收入的業(yè)務；但另一個更現(xiàn)實的問題也隨之出現(xiàn)：當人形機器人第一次成為收入核心，優(yōu)必選究竟是走到了商業(yè)化拐點，還是仍停留在驗證階…

04-05

中糧·祥云小鎮(zhèn)春日啟幕藝術閱讀盛宴融合文化賦能美好生活新體驗

04-05

物業(yè)增值服務新路徑：多種經(jīng)營模式如何激活社區(qū)活力與效益雙提升

04-05

線下零售“信任優(yōu)勢”凸顯，大額交易中如何筑牢獨特競爭力？