真实夫妻露脸自拍视频在线播放-亚洲精品乱码久久久久久蜜月-免费动漫成人av在线观看-中文字幕av三区三级爽-日韩熟女人妻一区二区-亚洲欧美乱日韩乱国产-一二三四区中文字幕在线-国产美女香蕉久久精品-久久视频在线播放视频

ClawBench大模型榜單揭曉:智譜字節(jié)小米四款模型強(qiáng)勢(shì)闖入全球前十

   時(shí)間:2026-04-01 03:52 來(lái)源:快訊作者:PConline太平洋科技

全球知名評(píng)測(cè)機(jī)構(gòu)ClawBench最新發(fā)布的大型模型榜單引發(fā)行業(yè)關(guān)注,北京三家人工智能企業(yè)的四款模型成功躋身全球前十,展現(xiàn)了中國(guó)AI技術(shù)的強(qiáng)勁實(shí)力。其中智譜科技研發(fā)的GLM-5-Turbo以93.9分的絕對(duì)優(yōu)勢(shì)登頂榜首,字節(jié)跳動(dòng)旗下的豆包模型Doubao-Seed-2.0-lite緊隨其后位列第二,同時(shí)憑借最低的使用成本成為最具性價(jià)比的模型。

小米科技成為本次榜單的最大黑馬,其自主研發(fā)的MiMo-V2系列兩款模型同時(shí)入圍前十。MiMo-V2-Omni憑借卓越的運(yùn)行速度斬獲第九名,而功能更強(qiáng)大的MiMo-V2-Pro在復(fù)雜邏輯推理、長(zhǎng)指令遵循等核心維度表現(xiàn)突出,在Model Rank專業(yè)排名中位居全球第五。該機(jī)構(gòu)數(shù)據(jù)顯示,小米在實(shí)驗(yàn)室綜合研發(fā)能力評(píng)估中同樣表現(xiàn)亮眼,在Text Arena(ArenaExpert)和Code Arena兩大權(quán)威榜單中分別位列全球第四和第五,綜合研發(fā)實(shí)力僅次于Anthropic、OpenAI和谷歌三家國(guó)際頂尖機(jī)構(gòu)。

ClawBench采用的評(píng)測(cè)機(jī)制具有顯著創(chuàng)新性,其關(guān)聯(lián)的Text Arena榜單通過(guò)雙盲測(cè)試模式,在完全隱藏模型身份的前提下,由全球真實(shí)用戶根據(jù)實(shí)際使用體驗(yàn)進(jìn)行投票評(píng)選。這種評(píng)測(cè)方式有效規(guī)避了傳統(tǒng)榜單中針對(duì)特定數(shù)據(jù)集進(jìn)行優(yōu)化的"刷榜"行為,確保評(píng)測(cè)結(jié)果能夠真實(shí)反映模型在真實(shí)場(chǎng)景中的表現(xiàn),為行業(yè)提供了更具參考價(jià)值的評(píng)估標(biāo)準(zhǔn)。

 
 
更多>同類天脈資訊
全站最新
熱門(mén)內(nèi)容
媒體信息
新傳播周刊
新傳播,傳播新經(jīng)濟(jì)之聲!
網(wǎng)站首頁(yè)  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)隱私  |  RSS訂閱  |  違規(guī)舉報(bào) 魯公網(wǎng)安備37010202700497號(hào)