真实夫妻露脸自拍视频在线播放-亚洲精品乱码久久久久久蜜月-免费动漫成人av在线观看-中文字幕av三区三级爽-日韩熟女人妻一区二区-亚洲欧美乱日韩乱国产-一二三四区中文字幕在线-国产美女香蕉久久精品-久久视频在线播放视频

阿里開源Qwen3.5小尺寸模型系列,性能亮眼引馬斯克關注與網(wǎng)友熱議

   時間:2026-03-03 15:50 來源:天脈網(wǎng)作者:顧雨柔

阿里近日宣布開源Qwen3.5系列中的四款小尺寸模型,包括Qwen3.5-0.8B、Qwen3.5-2B、Qwen3.5-4B和Qwen3.5-9B。這些模型專為筆記本電腦等端側設備設計,支持在消費級顯卡上運行,并允許通過LoRA或全量微調(diào)進行任務適配。

在性能評測中,Qwen3.5-9B在多項基準測試中表現(xiàn)突出,尤其在GPQA Diamond、MMMU-Pro、ERQA和Video-MME等任務中超越了GPT-OSS-20B、GPT-5 nano和Gemini 2.5 Flash-Lite等競品。盡管Qwen3.5-4B作為更小版本,在多語言知識、視覺推理和文檔理解等任務上接近9B版本的水平,但在純數(shù)學推理方面仍有提升空間。

開發(fā)者社區(qū)對這批模型的發(fā)布反應熱烈。一位開發(fā)者指出,Qwen3.5-9B在MMMU-Pro測試中以13分優(yōu)勢擊敗GPT-5-Nano,證明架構設計比參數(shù)規(guī)模更重要。另一位開發(fā)者分享了實際使用體驗:在Mac mini上運行Qwen3.5-9B,結合OpenClaw工具,可構建成本低于初級員工月薪的AI系統(tǒng)。還有用戶通過AMD Ryzen AI Max+395處理器和Q4_K_XL量化算法,實現(xiàn)了約30個token/s的處理速度,且顯存占用不足16GB。

不同版本模型針對特定場景優(yōu)化:0.8B和2B版本以輕量化見長,適合移動設備和低延遲交互場景;4B版本作為多模態(tài)基座模型,可平衡性能與資源消耗;9B版本則在緊湊結構下實現(xiàn)接近GPT-OSS-120B的性能,成為服務器端高性價比選擇。所有模型均采用Apache 2.0協(xié)議開源,基座模型也同步開放。

社區(qū)討論中,有用戶提出Qwen3.5系列可在手機端運行,引發(fā)關于iPhone部署方案的追問。不過也有開發(fā)者客觀指出,4B模型在復雜推理任務中正確率不足50%,數(shù)學測試正確率僅約15%,更適合作為自動補全工具而非深度思考伙伴。盡管存在局限,但這些小尺寸模型在特定能力維度已達到Gemini 3 Flash等云端模型的水平,具備實際端側應用價值。

目前Qwen3.5家族已形成完整產(chǎn)品線,包含1個397B參數(shù)的大尺寸模型、3個中型模型(122B、35B、27B)和4個新發(fā)布的小尺寸模型。開發(fā)者可通過魔搭社區(qū)和Hugging Face平臺獲取相關資源。

 
 
更多>同類天脈資訊
全站最新
熱門內(nèi)容
媒體信息
新傳播周刊
新傳播,傳播新經(jīng)濟之聲!
網(wǎng)站首頁  |  關于我們  |  聯(lián)系方式  |  版權隱私  |  RSS訂閱  |  違規(guī)舉報 魯公網(wǎng)安備37010202700497號