真实夫妻露脸自拍视频在线播放-亚洲精品乱码久久久久久蜜月-免费动漫成人av在线观看-中文字幕av三区三级爽-日韩熟女人妻一区二区-亚洲欧美乱日韩乱国产-一二三四区中文字幕在线-国产美女香蕉久久精品-久久视频在线播放视频

林俊旸離職后首談AI:剖析千問(wèn)技術(shù)彎路,展望智能體式思考新方向

   時(shí)間:2026-03-27 07:19 來(lái)源:快訊作者:量子位

林俊旸在離開(kāi)阿里千問(wèn)團(tuán)隊(duì)后首次公開(kāi)發(fā)聲,未對(duì)離職風(fēng)波或個(gè)人去向作出回應(yīng),而是以一篇長(zhǎng)文深入探討了AI領(lǐng)域從“推理模型時(shí)代”向“智能體時(shí)代”的演進(jìn)邏輯。

千問(wèn)團(tuán)隊(duì)曾嘗試將“思考模式”與“指令模式”整合到單一模型中,Qwen3便是這一思路的代表性成果。該模型引入混合思維框架,試圖通過(guò)四階段后訓(xùn)練流水線實(shí)現(xiàn)兩種模式的動(dòng)態(tài)平衡。然而,林俊旸坦言,這種融合面臨本質(zhì)性挑戰(zhàn):指令模式追求簡(jiǎn)潔高效,而思考模式需要深度探索,兩者在數(shù)據(jù)分布和行為目標(biāo)上的差異導(dǎo)致合并后的模型表現(xiàn)平庸——思考變得冗余猶豫,指令變得遲緩昂貴。盡管2025年下半年千問(wèn)團(tuán)隊(duì)拆分了獨(dú)立版本,但林俊旸認(rèn)為,真正的突破應(yīng)在于構(gòu)建“推理力度連續(xù)光譜”,使模型能自適應(yīng)調(diào)整思考深度。

行業(yè)對(duì)推理模型的探索已進(jìn)入新階段。OpenAI的o1和DeepSeek-R1驗(yàn)證了通過(guò)強(qiáng)化學(xué)習(xí)訓(xùn)練“先思考后回答”能力的可行性,其核心在于利用數(shù)學(xué)、代碼等強(qiáng)反饋信號(hào)優(yōu)化模型正確性。但林俊旸指出,當(dāng)前研究重心正從“延長(zhǎng)思考時(shí)間”轉(zhuǎn)向“為行動(dòng)而思考”。智能體式思維要求模型在與環(huán)境交互中動(dòng)態(tài)修正計(jì)劃,而非僅生成靜態(tài)推理軌跡。例如,編程任務(wù)中,智能體需通過(guò)執(zhí)行、調(diào)試、迭代逐步優(yōu)化代碼,而非一次性輸出完整方案;工具調(diào)用需根據(jù)實(shí)時(shí)反饋調(diào)整策略,而非依賴預(yù)設(shè)函數(shù)庫(kù)。

智能體時(shí)代的到來(lái)對(duì)技術(shù)棧提出全新要求。傳統(tǒng)推理強(qiáng)化學(xué)習(xí)依賴靜態(tài)評(píng)估環(huán)境,而智能體訓(xùn)練需構(gòu)建包含工具服務(wù)器、模擬器、執(zhí)行沙箱的閉環(huán)系統(tǒng)。林俊旸強(qiáng)調(diào),環(huán)境設(shè)計(jì)已成為核心能力,其穩(wěn)定性、真實(shí)性和反饋豐富度直接影響模型效能。例如,編程智能體若在訓(xùn)練中直接搜索答案而非自主推理,雖能提升短期指標(biāo),卻會(huì)削弱實(shí)際解決問(wèn)題的能力。多智能體協(xié)作框架逐漸興起,通過(guò)編排者分配任務(wù)、領(lǐng)域?qū)<姨幚砑?xì)分問(wèn)題、子智能體維護(hù)上下文隔離,實(shí)現(xiàn)復(fù)雜任務(wù)的高效分解與執(zhí)行。

技術(shù)路徑的分野已顯現(xiàn)。Anthropic的Claude系列通過(guò)可控思維預(yù)算整合推理與工具使用,將編程質(zhì)量和長(zhǎng)周期任務(wù)作為首要目標(biāo);GLM-4.5則統(tǒng)一推理、編程與智能體能力,強(qiáng)調(diào)動(dòng)態(tài)規(guī)劃與跨輪次連貫性。林俊旸認(rèn)為,這些實(shí)踐揭示了未來(lái)方向:從訓(xùn)練單一模型轉(zhuǎn)向訓(xùn)練智能體系統(tǒng),競(jìng)爭(zhēng)優(yōu)勢(shì)將源于環(huán)境構(gòu)建、編排工程及閉環(huán)決策能力。例如,智能體需在部分可觀測(cè)環(huán)境中處理噪聲數(shù)據(jù),在失敗后修正策略而非重新規(guī)劃,這些能力無(wú)法通過(guò)延長(zhǎng)推理時(shí)間實(shí)現(xiàn),而需通過(guò)與真實(shí)世界的交互迭代獲得。

隨著工具賦能的思維模式成為主流,AI研究正從“追求更長(zhǎng)推理軌跡”轉(zhuǎn)向“優(yōu)化有效行動(dòng)路徑”。林俊旸的論述為行業(yè)提供了新視角:真正的智能不在于輸出多少文字,而在于能否在復(fù)雜環(huán)境中持續(xù)產(chǎn)生實(shí)際價(jià)值。這一轉(zhuǎn)變或?qū)⒅匦露xAI技術(shù)的評(píng)價(jià)體系與發(fā)展方向。

 
 
更多>同類天脈資訊
全站最新
熱門(mén)內(nèi)容
媒體信息
新傳播周刊
新傳播,傳播新經(jīng)濟(jì)之聲!
網(wǎng)站首頁(yè)  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)隱私  |  RSS訂閱  |  違規(guī)舉報(bào) 魯公網(wǎng)安備37010202700497號(hào)