真实夫妻露脸自拍视频在线播放-亚洲精品乱码久久久久久蜜月-免费动漫成人av在线观看-中文字幕av三区三级爽-日韩熟女人妻一区二区-亚洲欧美乱日韩乱国产-一二三四区中文字幕在线-国产美女香蕉久久精品-久久视频在线播放视频

Anthropic新模型Claude Sonnet 4.6來(lái)襲,多項(xiàng)能力超Opus,軟件股承壓

   時(shí)間:2026-02-20 02:43 來(lái)源:快訊作者:智東西

Anthropic公司近日推出其最新人工智能模型Claude Sonnet 4.6,在編程、計(jì)算機(jī)操作、長(zhǎng)上下文推理等多個(gè)領(lǐng)域展現(xiàn)出顯著進(jìn)步。這款新模型不僅在性能上接近其高端系列Opus,還在成本方面更具優(yōu)勢(shì),引發(fā)業(yè)界廣泛關(guān)注。

根據(jù)Anthropic公布的基準(zhǔn)測(cè)試數(shù)據(jù),Claude Sonnet 4.6在金融分析、辦公任務(wù)和視覺(jué)推理等關(guān)鍵指標(biāo)上已超越其2月6日發(fā)布的Opus 4.6版本。該模型支持100萬(wàn)token的上下文窗口,能夠處理更復(fù)雜的任務(wù)場(chǎng)景。對(duì)于免費(fèi)和Pro訂閱用戶,Sonnet 4.6已成為claude.ai和Claude Cowork平臺(tái)的默認(rèn)模型,并新增文件創(chuàng)建、連接器、專業(yè)技能與內(nèi)容壓縮等功能。

在定價(jià)策略上,Sonnet 4.6保持與前代版本相同的水平,每百萬(wàn)token輸入價(jià)格為3美元,輸出價(jià)格為15美元。這種高性價(jià)比特性使其在發(fā)布后迅速獲得市場(chǎng)認(rèn)可,導(dǎo)致美股軟件板塊出現(xiàn)波動(dòng)。截至美東時(shí)間周二收盤,Intuit股價(jià)下跌超過(guò)5%,甲骨文、Applovin跌幅超過(guò)3%,Salesforce、Atlassian等公司股價(jià)也有不同程度下滑。

開發(fā)者社區(qū)對(duì)Sonnet 4.6的反響熱烈。多位開發(fā)者在社交平臺(tái)分享使用體驗(yàn),展示該模型在代碼重構(gòu)、多文件修改等任務(wù)中的出色表現(xiàn)。有開發(fā)者表示,Sonnet 4.6僅通過(guò)一次調(diào)用就完成了整個(gè)代碼庫(kù)的重構(gòu)工作,新增3000多行代碼并創(chuàng)建12個(gè)新文件。其百萬(wàn)token上下文窗口功能尤其受到稱贊,用戶可以導(dǎo)入整個(gè)代碼庫(kù)而無(wú)需擔(dān)心信息丟失。

在視覺(jué)推理能力方面,Sonnet 4.6也有顯著提升。測(cè)試顯示,該模型在生成SVG代碼創(chuàng)建Xbox控制器圖像的任務(wù)中,展現(xiàn)出比前代更強(qiáng)的立體感和細(xì)節(jié)處理能力。這種進(jìn)步使其在與Gemini和ChatGPT等模型的競(jìng)爭(zhēng)中更具優(yōu)勢(shì)。

Anthropic特別強(qiáng)調(diào)Sonnet 4.6在計(jì)算機(jī)使用方面的突破。該模型在OSWorld基準(zhǔn)測(cè)試中表現(xiàn)出色,能夠像人類一樣操作Chrome、LibreOffice等真實(shí)軟件環(huán)境。早期用戶反饋顯示,Sonnet 4.6在處理復(fù)雜表格、填寫多步驟網(wǎng)頁(yè)表單等任務(wù)中已接近人類水平,顯著提高了辦公效率。

在開發(fā)模式上,Sonnet 4.6提供"擴(kuò)展思維"和"自適應(yīng)思維"兩種選擇。開發(fā)者可以根據(jù)任務(wù)需求調(diào)整模型的推理強(qiáng)度,這種靈活性使其能夠適應(yīng)不同場(chǎng)景的應(yīng)用需求。在Vending-Bench Arena商業(yè)模擬測(cè)試中,Sonnet 4.6展現(xiàn)出卓越的戰(zhàn)略規(guī)劃能力,通過(guò)前期投資和后期盈利的平衡策略,最終取得領(lǐng)先成績(jī)。

盡管Sonnet 4.6在多個(gè)領(lǐng)域表現(xiàn)優(yōu)異,但Anthropic承認(rèn),對(duì)于需要深度推理的復(fù)雜任務(wù),Opus 4.6仍是首選方案。特別是在代碼庫(kù)重構(gòu)、多Agent協(xié)同工作等場(chǎng)景中,Opus系列仍保持著技術(shù)優(yōu)勢(shì)。這種分層產(chǎn)品策略使Anthropic能夠滿足不同用戶群體的需求。

安全評(píng)估顯示,Sonnet 4.6在多語(yǔ)言場(chǎng)景下均能保持穩(wěn)定表現(xiàn)。研究人員使用普通話、阿拉伯語(yǔ)、英語(yǔ)等七種語(yǔ)言測(cè)試模型的信息提供意愿和違規(guī)請(qǐng)求響應(yīng)能力,結(jié)果顯示該模型在各種語(yǔ)言環(huán)境下都能有效識(shí)別并拒絕潛在有害請(qǐng)求。

 
 
更多>同類天脈資訊
全站最新
熱門內(nèi)容
媒體信息
新傳播周刊
新傳播,傳播新經(jīng)濟(jì)之聲!
網(wǎng)站首頁(yè)  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)隱私  |  RSS訂閱  |  違規(guī)舉報(bào) 魯公網(wǎng)安備37010202700497號(hào)