近日,OpenAI聯(lián)合創(chuàng)始人兼總裁Greg Brockman在一場播客訪談中,揭開了公司戰(zhàn)略調(diào)整背后的諸多細(xì)節(jié),引發(fā)行業(yè)廣泛關(guān)注。此次訪談不僅回應(yīng)了外界對OpenAI放棄Sora項目的猜測,還透露了未來重點布局的Super App、新模型“Spud”以及AI研究員等關(guān)鍵信息。
針對外界對OpenAI放棄Sora項目的質(zhì)疑,Greg表示,這并非從消費端轉(zhuǎn)向B2B,而是基于戰(zhàn)略聚焦的考慮。OpenAI目前同時推進(jìn)兩條技術(shù)路線:一是研發(fā)深度學(xué)習(xí)技術(shù),二是部署技術(shù)以積累落地經(jīng)驗。當(dāng)前技術(shù)已驗證可行,需進(jìn)入真實世界獲取反饋,因此公司決定將主要精力放在GPT系列上,包括文本和語音交互等領(lǐng)域。Sora項目并未被完全放棄,而是轉(zhuǎn)向機器人領(lǐng)域繼續(xù)研究,但短期內(nèi)難以在知識工作領(lǐng)域大規(guī)模落地。
當(dāng)被問及為何不押注視頻生成技術(shù)時,Greg指出,盡管視頻生成進(jìn)步顯著,但機會過多時需排序和把握時機。OpenAI已確信文本模型可通往AGI,且今年將推出更強模型。例如,某物理學(xué)家借助OpenAI模型在12小時內(nèi)解決了研究難題,這種“思考”能力讓公司決定加倍投入文本模型路線。對于競爭對手DeepMind認(rèn)為圖像生成器更接近AGI的觀點,Greg回應(yīng)稱,OpenAI從一開始就選擇了相信的AGI路徑,且圖像生成功能已基于GPT架構(gòu)實現(xiàn),而非擴散模型。
關(guān)于備受矚目的Super App,Greg透露,它將整合編程、瀏覽器和ChatGPT,成為用戶體驗AGI力量的端點應(yīng)用。這款應(yīng)用不僅是工具,更是“個人助理”,能理解用戶目標(biāo)、建立信任關(guān)系。未來,Super App將具備記憶功能,連接郵件、日歷等,深入幫助用戶達(dá)成目標(biāo)。該應(yīng)用將于未來幾個月分步推進(jìn),起點是Codex應(yīng)用,第一步是讓Codex對普通知識工作更友好。
在競爭方面,Greg承認(rèn)Anthropic的Claude Code等類似功能已出現(xiàn),但OpenAI在編程方向上一直重視,且正在補上“最后一公里”的易用性。去年年中,公司組建團隊聚焦真實世界問題,構(gòu)建訓(xùn)練環(huán)境,讓AI適應(yīng)實際軟件工程中的混亂情況。如今,OpenAI在競爭中已占據(jù)優(yōu)勢,用戶更傾向于選擇其產(chǎn)品。
傳聞中的新模型“Spud”也在此次訪談中揭開面紗。Greg表示,“Spud”是OpenAI過去兩年研究成果的體現(xiàn),是一個新的預(yù)訓(xùn)練模型。它能解決更復(fù)雜的問題,理解力更強,對上下文把握更好,既能拉高問題解決的天花板,也能提升基礎(chǔ)體驗。不過,普通用戶能否明顯感覺到變化取決于應(yīng)用場景,有些人會感覺天差地別,有些應(yīng)用則變化不明顯。但隨著技術(shù)變強,用戶會逐漸感知到AI“能幫上忙”。
OpenAI內(nèi)部正在開發(fā)的自動化AI研究員計劃秋季推出。Greg介紹,該研究員將實現(xiàn)研究科學(xué)家工作流程的自動化,目前已能承擔(dān)相當(dāng)比例的科研任務(wù)。公司會像帶初級研究員一樣,給它方向并審閱結(jié)果。對于AI發(fā)展可能帶來的風(fēng)險,Greg表示擔(dān)憂,但OpenAI在技術(shù)上投入了很多保障安全的措施,如防止提示詞注入攻擊。同時,公司認(rèn)為應(yīng)構(gòu)建“有韌性的開放系統(tǒng)”,讓眾多參與者共同開發(fā)AI,并圍繞技術(shù)建立社會基礎(chǔ)設(shè)施。
對于AGI的實現(xiàn)時間,Greg認(rèn)為不同人定義不同,若以他個人標(biāo)準(zhǔn),已完成70%到80%,未來幾年內(nèi)將擁有能完成電腦上幾乎任何智力任務(wù)的AGI。在模型發(fā)展路徑上,Greg指出,隨著基礎(chǔ)模型變強,AI從能完成20%的任務(wù)躍升到80%,帶來了巨大變化。未來,公司將繼續(xù)在每個維度上推進(jìn),如讓AI操作電腦、建設(shè)企業(yè)級配套技術(shù)、推動語音交互等。公司還在理解模型能力階段,將訓(xùn)練擴展到開放式問題領(lǐng)域。
針對是否需要大規(guī)模預(yù)訓(xùn)練的討論,Greg認(rèn)為模型生產(chǎn)流程的每一步都有相乘效應(yīng),更強的預(yù)訓(xùn)練會讓后續(xù)步驟更輕松。公司要平衡預(yù)訓(xùn)練和推理能力,找到“智能×成本”的最優(yōu)解。在算力方面,Greg表示,無論訓(xùn)練和推理配比如何變化,大規(guī)模訓(xùn)練仍需集中算力,且NVIDIA團隊出色,OpenAI與其深度合作。公司今年融到的資金將投入數(shù)據(jù)中心,因為算力是收入中心,增長永遠(yuǎn)趕不上需求。對于其他玩家“過于冒進(jìn)”的評論,Greg不同意,他認(rèn)為OpenAI審慎且前瞻性地判斷了技術(shù)走向,提前布局算力。
在公眾對AI的接受度方面,Greg認(rèn)為需要向大眾展示AI如何改善生活,如有人用ChatGPT協(xié)助診斷出孩子被誤診的腦瘤。對于數(shù)據(jù)中心帶來的環(huán)境和電費擔(dān)憂,他解釋稱水資源消耗小,公司會支付能源費用,不推高居民電價,某些地方數(shù)據(jù)中心還幫助升級了電網(wǎng),降低了居民電費。最后,Greg建議害怕AI的人親自體驗工具,理解其利弊,而最能從AI中受益的人是帶著好奇心嘗試并將其融入工作流程的人。























