真实夫妻露脸自拍视频在线播放-亚洲精品乱码久久久久久蜜月-免费动漫成人av在线观看-中文字幕av三区三级爽-日韩熟女人妻一区二区-亚洲欧美乱日韩乱国产-一二三四区中文字幕在线-国产美女香蕉久久精品-久久视频在线播放视频

Claude Sonnet 4.6發(fā)布實(shí)力升級(jí),馬斯克Grok 4.20同期上線口碑兩極

   時(shí)間:2026-02-18 09:23 來源:天脈網(wǎng)作者:任飛揚(yáng)

完成高達(dá)300億美元的融資后,人工智能公司Anthropic終于交出了其首份技術(shù)答卷。該公司正式發(fā)布了新一代模型Claude Sonnet 4.6,并宣稱其為“史上最強(qiáng)Sonnet版本”。這一升級(jí)覆蓋了編程、計(jì)算機(jī)操作、長(zhǎng)上下文推理以及智能體規(guī)劃等多個(gè)核心領(lǐng)域,且在保持原有價(jià)格體系不變的情況下,性能表現(xiàn)已接近高端型號(hào)Opus的水平。

在對(duì)比測(cè)試中,Sonnet 4.6展現(xiàn)出了顯著優(yōu)勢(shì)。數(shù)據(jù)顯示,59%的用戶更傾向于選擇Sonnet 4.6而非Opus 4.5,主要原因是其過度工程化現(xiàn)象減少、幻覺問題降低,以及在多步驟任務(wù)執(zhí)行中的穩(wěn)定性更強(qiáng)。這一結(jié)果無疑為Anthropic在激烈的市場(chǎng)競(jìng)爭(zhēng)中增添了重要籌碼。

計(jì)算機(jī)操作能力的提升是此次升級(jí)的一大亮點(diǎn)。經(jīng)過16個(gè)月的持續(xù)優(yōu)化,Sonnet系列在OSWorld基準(zhǔn)測(cè)試中的表現(xiàn)已接近人類水平,能夠熟練處理復(fù)雜電子表格和填寫多步驟網(wǎng)頁表單等任務(wù)。這一突破對(duì)于眾多依賴?yán)吓f軟件的企業(yè)而言意義重大,因?yàn)樗鼈儫o需再為這些軟件開發(fā)專門的連接器,從而大幅降低了工程成本。

針對(duì)金融行業(yè)用戶,Anthropic還同步升級(jí)了Excel中的Claude插件,新增了MCP連接器支持,進(jìn)一步提升了其實(shí)用性。Sonnet 4.6還支持高達(dá)100萬token的超大上下文,足以在一次請(qǐng)求中處理完整代碼庫(kù)、數(shù)十篇論文或大量合同文件,為需要處理大量數(shù)據(jù)的用戶提供了極大便利。

在模擬企業(yè)運(yùn)營(yíng)的評(píng)估Vending-Bench Arena中,Sonnet 4.6展現(xiàn)出了出色的長(zhǎng)期規(guī)劃能力。它能夠在前期大舉投資產(chǎn)能,然后在最后階段迅速轉(zhuǎn)向盈利導(dǎo)向,通過精準(zhǔn)把握轉(zhuǎn)折時(shí)機(jī)來甩開其他競(jìng)爭(zhēng)對(duì)手。這一策略不僅體現(xiàn)了其強(qiáng)大的推理能力,也為企業(yè)在實(shí)際運(yùn)營(yíng)中提供了有益的參考。

對(duì)于普通用戶而言,F(xiàn)ree和Pro方案的默認(rèn)模型已經(jīng)切換為Sonnet 4.6,用戶可以在claude.ai和Claude Cowork上同步體驗(yàn)到這一升級(jí)帶來的變化。而對(duì)于開發(fā)者來說,API模型標(biāo)識(shí)為claude-sonnet-4-6,支持自適應(yīng)思考和擴(kuò)展思考功能。同時(shí),上下文壓縮功能可以在對(duì)話接近上下文限制時(shí)自動(dòng)總結(jié)舊內(nèi)容,既節(jié)省了token又提高了使用效率。

就在Sonnet 4.6發(fā)布的同時(shí),馬斯克旗下的xAI也推出了Grok 4.20測(cè)試版。該版本支持并行調(diào)度四個(gè)專業(yè)智能體協(xié)同執(zhí)行任務(wù),但整體口碑卻呈現(xiàn)出兩極分化的態(tài)勢(shì)。由于此前預(yù)期過高,導(dǎo)致不少用戶在體驗(yàn)后感到失望,紛紛給出差評(píng)。面對(duì)這一局面,馬斯克迅速在社交媒體上連發(fā)多條推文進(jìn)行解釋和安撫。

他解釋稱,目前的Grok 4.20只是一個(gè)參數(shù)量為500B的小型基礎(chǔ)模型,尚處于公測(cè)階段。他強(qiáng)調(diào),Grok 4.20的底層架構(gòu)具備每周自我迭代的能力,遞歸式智能增長(zhǎng)空間巨大。馬斯克還承諾,在公測(cè)結(jié)束后,Grok 4.20的智能和速度將比Grok 4提升約一個(gè)數(shù)量級(jí)。然而,這一承諾能否如期兌現(xiàn),仍有待市場(chǎng)和用戶的進(jìn)一步檢驗(yàn)。

 
 
更多>同類天脈資訊
全站最新
熱門內(nèi)容
媒體信息
新傳播周刊
新傳播,傳播新經(jīng)濟(jì)之聲!
網(wǎng)站首頁  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)隱私  |  RSS訂閱  |  違規(guī)舉報(bào) 魯公網(wǎng)安備37010202700497號(hào)