成人美女黄网站免费|哔哩哔哩免费观看在线视频|freexx老女人|欧美精品三区|近的2019中文字幕在线|97中文字幕一区二区|日本jazz护士

巨人財(cái)經(jīng) - 專業(yè)科技行業(yè)財(cái)經(jīng)媒體

阿里發(fā)布萬(wàn)億參數(shù)千問(wèn)旗艦推理模型Qwen3-Max-Thinking 性能效率雙提升

   發(fā)布時(shí)間:2026-01-27 21:01 作者:吳俊

阿里巴巴正式推出其最新研發(fā)的千問(wèn)旗艦推理模型Qwen3-Max-Thinking,標(biāo)志著該公司在人工智能領(lǐng)域又邁出重要一步。這款模型擁有超過(guò)萬(wàn)億參數(shù),預(yù)訓(xùn)練數(shù)據(jù)量達(dá)到36T Tokens,成為阿里迄今為止規(guī)模最大、性能最強(qiáng)的推理模型。

開(kāi)發(fā)者現(xiàn)在可以通過(guò)QwenChat平臺(tái)免費(fèi)體驗(yàn)Qwen3-Max-Thinking模型,企業(yè)用戶則可通過(guò)阿里云百煉平臺(tái)獲取該模型的API服務(wù)。普通用戶也能在千問(wèn)PC端和網(wǎng)頁(yè)端試用這一強(qiáng)大模型,千問(wèn)APP也即將完成新模型的接入,屆時(shí)所有用戶均可免費(fèi)體驗(yàn)其卓越性能。

在性能方面,Qwen3-Max-Thinking表現(xiàn)尤為突出。預(yù)覽版模型已在數(shù)學(xué)推理AIME 25和HMMT 25測(cè)試中斬獲國(guó)內(nèi)首個(gè)雙滿分,展現(xiàn)了驚人的推理能力。經(jīng)過(guò)更大規(guī)模的強(qiáng)化學(xué)習(xí)后訓(xùn)練,正式版模型的性能得到全面提升,特別是在推理效率方面實(shí)現(xiàn)了重大突破。

該模型采用了一種創(chuàng)新的測(cè)試時(shí)擴(kuò)展(Test-time Scaling)機(jī)制,能夠從之前的推理結(jié)果中提取"經(jīng)驗(yàn)"并進(jìn)行多輪自我迭代。這種機(jī)制避免了傳統(tǒng)推理計(jì)算中常見(jiàn)的冗余推導(dǎo),在相同上下文中實(shí)現(xiàn)了更高效的推理計(jì)算,從而獲得更智能的推理結(jié)果。基于這一技術(shù)創(chuàng)新,千問(wèn)在"人類最后的測(cè)試"HLE中取得58.3分的優(yōu)異成績(jī),遠(yuǎn)超GPT-5.2-Thinking的45.5分和Gemini 3 Pro的45.8分,創(chuàng)下當(dāng)前所有模型的最高分。

面向即將到來(lái)的智能體Agent時(shí)代,Qwen3-Max-Thinking還顯著增強(qiáng)了自主調(diào)用工具的原生Agent能力。這一改進(jìn)使模型能夠更自主地完成復(fù)雜任務(wù),為未來(lái)智能應(yīng)用的發(fā)展奠定了堅(jiān)實(shí)基礎(chǔ)。

在太空應(yīng)用領(lǐng)域,千問(wèn)大模型也取得了突破性進(jìn)展。2025年11月,國(guó)星宇航成功將千問(wèn)Qwen3大模型部署至"星算"計(jì)劃01組太空計(jì)算中心,這是全球首次實(shí)現(xiàn)在軌運(yùn)行的衛(wèi)星上部署通用大模型。該模型在太空中成功執(zhí)行多次端到端推理任務(wù),從地面上傳問(wèn)題到衛(wèi)星,由大模型完成在軌推理,再將結(jié)果數(shù)據(jù)回傳地面,整個(gè)過(guò)程耗時(shí)不到2分鐘。

在開(kāi)源社區(qū)方面,千問(wèn)系列模型同樣表現(xiàn)亮眼。全球最大AI開(kāi)源社區(qū)Hugging Face最新數(shù)據(jù)顯示,阿里千問(wèn)衍生模型數(shù)量已突破20萬(wàn)個(gè),成為全球首個(gè)達(dá)成此目標(biāo)的開(kāi)源大模型。同時(shí),千問(wèn)系列模型下載量突破10億次,平均每天被下載110萬(wàn)次,下載量已全面超越美國(guó)Llama模型,穩(wěn)居開(kāi)源大模型全球第一的位置。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容
本欄最新