OpenAI近日宣布,旗下ChatGPT的默認(rèn)模型正式升級(jí)為GPT-5.5 Instant,取代此前廣泛使用的GPT-5.3 Instant版本。此次更新覆蓋所有用戶,標(biāo)志著Instant系列模型在性能與用戶體驗(yàn)上邁入新階段。作為日常交互的主力模型,Instant系列每天處理數(shù)億次用戶請(qǐng)求,即使微小改進(jìn)也能產(chǎn)生顯著影響。
新模型的核心升級(jí)聚焦三大方向:準(zhǔn)確性、簡潔性與個(gè)性化能力。在高風(fēng)險(xiǎn)領(lǐng)域,如醫(yī)療、法律和金融咨詢中,GPT-5.5 Instant的幻覺率較前代下降52.5%,用戶標(biāo)記過的錯(cuò)誤對(duì)話復(fù)現(xiàn)率減少37.3%。其圖片分析、理科問題解答及搜索工具調(diào)用決策能力均顯著提升。數(shù)學(xué)與科學(xué)領(lǐng)域表現(xiàn)尤為突出:在AIME 2025數(shù)學(xué)競賽測試中,新模型得分81.2,遠(yuǎn)超GPT-5.3 Instant的65.4;博士級(jí)科學(xué)測試GPQA得分從78.5躍升至85.6,多模態(tài)推理基準(zhǔn)MMMU-Pro得分提升近7分。
OpenAI通過一道代數(shù)題對(duì)比展示了模型差異。當(dāng)用戶提交根式方程解題過程并詢問正確性時(shí),GPT-5.3 Instant僅發(fā)現(xiàn)x=3不滿足原方程便判定“無實(shí)數(shù)解”,而GPT-5.5 Instant進(jìn)一步定位到用戶展開(x-1)2時(shí)的計(jì)算錯(cuò)誤,并給出正確解答。這一案例凸顯了新模型在邏輯追蹤與錯(cuò)誤診斷上的深度優(yōu)化。
回復(fù)風(fēng)格方面,GPT-5.5 Instant大幅簡化輸出內(nèi)容,減少格式堆砌與冗余追問。以“如何委婉提醒同事少說話”為例,前代模型提供五種分類策略及“禁忌清單”,結(jié)構(gòu)完整但略顯繁瑣;新模型則縮減30%字?jǐn)?shù)與29%行數(shù),以朋友式建議聚焦“引導(dǎo)對(duì)話轉(zhuǎn)向自身需求”,避免直接評(píng)價(jià)對(duì)方習(xí)慣。這種轉(zhuǎn)變使交互更自然高效。
個(gè)性化功能是本次升級(jí)的另一亮點(diǎn)。Plus與Pro用戶可授權(quán)模型調(diào)用歷史對(duì)話、上傳文件及關(guān)聯(lián)Gmail內(nèi)容,生成更貼合個(gè)人場景的回答。例如,在茶館推薦場景中,GPT-5.3 Instant僅根據(jù)用戶所在舊金山推薦熱門店鋪,而新模型從歷史記錄中提取用戶常去Asha Tea House、偏好高山茶的信息,精準(zhǔn)推薦風(fēng)格匹配的Ceré Tea與Song Tea & Ceramics,并附上推薦邏輯。
技術(shù)迭代與用戶體驗(yàn)升級(jí)的同時(shí),OpenAI亦在社區(qū)互動(dòng)上別出心裁。公司創(chuàng)始人Sam Altman透露,在籌備GPT-5.5上線派對(duì)時(shí),他向模型詢問建議,后者給出詳細(xì)清單:希望派對(duì)定于美國當(dāng)?shù)貢r(shí)間5月5日下午5點(diǎn)55分,演講環(huán)節(jié)盡量簡短,安排人類創(chuàng)造者致祝酒詞但自己拒絕上臺(tái),并增設(shè)收集GPT-5.6建議的環(huán)節(jié)。這些要求最終被采納,派對(duì)地點(diǎn)選在舊金山總部,非本地嘉賓的差旅費(fèi)用由公司承擔(dān)。
受邀名單由Codex模型從推文回復(fù)中篩選,報(bào)名通道于4月30日下午5點(diǎn)55分關(guān)閉,24小時(shí)內(nèi)吸引超8000人參與。未入選者收到Codex調(diào)用額度提升10倍的補(bǔ)償(有效期至6月5日)。對(duì)于馬斯克是否受邀的問題,Altman笑稱“世界需要更多愛”,但鑒于對(duì)方正忙于對(duì)OpenAI的訴訟,這場慶祝活動(dòng)的香檳或許只能由OpenAI團(tuán)隊(duì)獨(dú)自享用。























