真实夫妻露脸自拍视频在线播放-亚洲精品乱码久久久久久蜜月-免费动漫成人av在线观看-中文字幕av三区三级爽-日韩熟女人妻一区二区-亚洲欧美乱日韩乱国产-一二三四区中文字幕在线-国产美女香蕉久久精品-久久视频在线播放视频

馬斯克xAI新模型Grok 4.2公測,通過趣味測試,回答風(fēng)格似“老馬”親臨

   時間:2026-02-18 18:38 來源:天脈網(wǎng)作者:顧雨柔

馬斯克旗下xAI公司推出的Grok 4.2公測Beta版在爭議聲中悄然上線。這款參數(shù)規(guī)模僅500B的模型,與當(dāng)前動輒數(shù)萬億參數(shù)的行業(yè)主流形成鮮明對比,其市場表現(xiàn)呈現(xiàn)出兩極分化的態(tài)勢——部分用戶盛贊其創(chuàng)新功能,另一派則直言性能不及預(yù)期。

面對質(zhì)疑聲浪,馬斯克在社交平臺展開密集公關(guān)行動。他不僅連續(xù)轉(zhuǎn)發(fā)十余條夸贊推文,更親自下場承諾:"公測將持續(xù)至下月,正式版將比Grok 4快得多、聰明得多。"據(jù)其透露,模型具備每周自我迭代的獨特能力,未來將形成固定更新節(jié)奏。這一表態(tài)與xAI聯(lián)合創(chuàng)始人近期離職引發(fā)的動蕩形成微妙對比,此前外界甚至猜測項目可能難產(chǎn)。

技術(shù)特性方面,Grok 4.2首次引入實時反饋優(yōu)化機制。與傳統(tǒng)靜態(tài)更新模式不同,新模型能根據(jù)用戶交互數(shù)據(jù)持續(xù)調(diào)整性能。在弱智吧風(fēng)格測試題"50米外洗車店該開車還是步行"中,該模型展現(xiàn)出邏輯推理能力,順利通過考驗。不過官方至今未公布完整技術(shù)報告,僅在排行榜釋放有限評測數(shù)據(jù),導(dǎo)致討論多集中于使用體驗而非技術(shù)細(xì)節(jié)。

用戶反饋呈現(xiàn)明顯分化。批評者指出,在處理復(fù)雜邏輯問題時,500B參數(shù)規(guī)模明顯力不從心,懷疑所謂"橫掃榜單"成績來自特定實驗環(huán)境優(yōu)化。更有開發(fā)者測算其使用成本高于競品模型。支持陣營則強調(diào)代碼生成速度和多模態(tài)處理能力,特別提及該模型通過"Caitlyn Jenner測試"——這道曾讓ChatGPT和Gemini折戟的性別認(rèn)知題,成為Grok 4.2的亮點戰(zhàn)績。

爭議焦點還涉及模型偏見問題。盡管馬斯克宣稱Grok 4.2保持中立,但測試顯示其回答傾向與創(chuàng)始人觀點高度吻合。對此馬斯克回應(yīng)稱:"這還是個寶寶模型",并預(yù)告中大型版本即將推出。AI工程師Mark Krechman的爆料得到本人轉(zhuǎn)發(fā)確認(rèn)——當(dāng)前版本實為"精簡版",完整功能尚未釋放。

在模型發(fā)布同期,xAI還推出Grok imagine視頻生成模板,目前僅限iOS用戶體驗。這款馬年主題創(chuàng)作工具,為爭議中的產(chǎn)品矩陣增添新變量。隨著公測推進(jìn),每周迭代機制能否兌現(xiàn)承諾,將成為決定Grok 4.2命運的關(guān)鍵因素。

 
 
更多>同類天脈資訊
全站最新
熱門內(nèi)容
媒體信息
新傳播周刊
新傳播,傳播新經(jīng)濟之聲!
網(wǎng)站首頁  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)隱私  |  RSS訂閱  |  違規(guī)舉報 魯公網(wǎng)安備37010202700497號