前阿里千問大模型負責人林俊旸在離職后,其創業計劃引發了廣泛關注。據悉,他即將創立的新公司雖尚未公布名稱,但種子輪目標估值已高達20億美元,折合人民幣約135億元。這一數字對于一家尚未發布產品的中國AI初創企業而言,幾乎無前例可循,但與林俊旸在硅谷的同行相比,這一估值并不算高。
林俊旸于2019年加入阿里巴巴,早期專注于搜索、推薦場景下的自然語言處理和多模態建模研究。2020年,他開始投身于大規模預訓練模型的研究與部署,深度參與了M6等超大規模預訓練模型項目。M6作為阿里早期最具代表性的多模態大模型項目之一,為林俊旸積累了豐富的經驗。2022年后,他轉向通用大模型方向,并成為Qwen項目的技術負責人,帶領團隊打造了Qwen系列大語言與多模態模型,并主導了開源工作。Qwen項目不僅成為阿里AI對外展示的重要技術名片,還以其多樣化的模型尺寸、開源路線以及持續更新的多模態、代碼和輕量化模型版本,贏得了開發者的廣泛認可。
林俊旸的創業之所以備受矚目,不僅因為他在Qwen項目中的卓越貢獻,更因為他對未來AI發展方向的獨到見解。離職后,他發表了一篇題為《From “Reasoning” Thinking to “Agentic” Thinking》的長文,對過去一年的模型競爭進行了復盤,并暗示了下一階段創業方向的技術路線。
在這篇長文中,林俊旸提出,上一階段的AI競爭聚焦于讓模型更會思考,而下一階段的競爭則將轉向讓模型為了行動而思考。他強調,真正的挑戰在于代碼庫導航、計劃拆解、錯誤恢復、工具編排以及長時間執行任務的質量。為此,他引入了“Agentic Thinking”這一核心概念,即一種“為了行動而思考”的能力。這種能力不僅要求模型在回答前進行更長時間的推理,更要求模型能夠在環境中行動、觀察反饋、修正計劃,并繼續推進。
林俊旸認為,隨著反饋信號的可靠性和基礎設施支撐能力的提升,語言模型之上的強化學習(RL)已經能夠產出質的飛躍式的認知能力。然而,更深層次的轉變是從推理式思考到智能體式思考,即從想得更久到為了行動而想。這一轉變意味著訓練的核心對象已經變成了模型與環境的系統,或者更具體地說,是智能體和圍繞它的編排框架。因此,環境設計、軌跡采樣基礎設施、評估器魯棒性以及多智能體之間的協調接口等要素變得同樣關鍵。
自發表長文后,林俊旸在個人社交媒體上鮮有發聲,僅轉發了一條關于持續學習基準測試的消息,引發外界對其創業方向的進一步猜測。據The Information報道,已有兩家知名投資機構就投資事宜與林俊旸的實驗室進行了深入洽談,這無疑為他的創業計劃增添了更多期待。





















