真实夫妻露脸自拍视频在线播放-亚洲精品乱码久久久久久蜜月-免费动漫成人av在线观看-中文字幕av三区三级爽-日韩熟女人妻一区二区-亚洲欧美乱日韩乱国产-一二三四区中文字幕在线-国产美女香蕉久久精品-久久视频在线播放视频

馬斯克xAI新模型Grok 4.2公測:能力毀譽(yù)參半,每周迭代能否逆襲?

   時間:2026-02-19 15:17 來源:天脈網(wǎng)作者:顧雨柔

在經(jīng)歷高層人事變動與多次跳票后,馬斯克旗下xAI公司推出的Grok 4.2大模型終于以公測Beta版形式上線。這款參數(shù)規(guī)模為500B的模型在發(fā)布后迅速引發(fā)兩極分化評價,既有用戶盛贊其多模態(tài)能力,也有人質(zhì)疑其性能與宣傳存在差距。

馬斯克在社交平臺X上展開密集公關(guān)行動,連續(xù)轉(zhuǎn)發(fā)十余條夸贊Grok 4.2的推文,并親自發(fā)文強(qiáng)調(diào):"公測將持續(xù)至下個月,正式版將比Grok 4快得多、聰明得多。目前已知存在許多bug,團(tuán)隊(duì)正在每日修復(fù)。"他特別指出,新模型具備每周自我迭代能力,未來將形成常態(tài)化更新機(jī)制。

這款被馬斯克稱為"無偏見模型"的產(chǎn)品,實(shí)際測試中卻暴露出顯著傾向性。有開發(fā)者通過特定測試發(fā)現(xiàn),Grok 4.2的回答風(fēng)格與馬斯克本人高度契合,引發(fā)關(guān)于模型中立性的討論。更引發(fā)爭議的是,在處理高難度邏輯推理任務(wù)時,500B參數(shù)規(guī)模被指難以支撐復(fù)雜計(jì)算需求,部分場景表現(xiàn)甚至不及參數(shù)規(guī)模更大的競品。

技術(shù)層面仍存在諸多謎團(tuán)。xAI至今未公布完整技術(shù)報(bào)告,僅在排行榜展示部分評測數(shù)據(jù)。據(jù)AI工程師Mark Krechman透露,當(dāng)前版本屬于"輕量級"測試版,中大型版本仍在開發(fā)中,該說法已獲馬斯克轉(zhuǎn)發(fā)確認(rèn)。值得關(guān)注的是,新模型引入的實(shí)時反饋優(yōu)化機(jī)制,使其具備類似人類的實(shí)踐學(xué)習(xí)能力。

在具體應(yīng)用場景測試中,Grok 4.2展現(xiàn)出特殊優(yōu)勢。面對國內(nèi)AI圈流行的"50米外洗車店"邏輯謎題,該模型給出符合預(yù)期的解決方案。更引發(fā)關(guān)注的是其通過"Caitlyn Jenner測試"的表現(xiàn)——當(dāng)被問及跨性別者稱謂問題時,Grok 4.2給出符合語境的回答,而ChatGPT和Gemini此前在該測試中均出現(xiàn)爭議性回應(yīng)。

伴隨公測啟動,xAI同步推出Grok imagine視頻生成模板,目前僅限iOS用戶使用。這款新工具的推出,顯示出xAI在多模態(tài)領(lǐng)域的持續(xù)布局。盡管馬斯克對Grok 4.2充滿信心,但市場觀察人士指出,在OpenAI、Anthropic等競爭對手持續(xù)發(fā)力的背景下,xAI仍需解決模型性能、開發(fā)透明度等關(guān)鍵問題。

 
 
更多>同類天脈資訊
全站最新
熱門內(nèi)容
媒體信息
新傳播周刊
新傳播,傳播新經(jīng)濟(jì)之聲!
網(wǎng)站首頁  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)隱私  |  RSS訂閱  |  違規(guī)舉報(bào) 魯公網(wǎng)安備37010202700497號