在人工智能大模型領(lǐng)域,短短兩年間,行業(yè)格局與認(rèn)知已發(fā)生深刻變革。2024年初,壁仞科技聯(lián)合創(chuàng)始人徐凌杰告別GPU市場(chǎng),投身創(chuàng)立魔形智能(Magik Compute),立志打造“AI Token Factory”,彼時(shí)這一概念尚顯陌生。然而,到2026年,隨著OpenClaw、Seedance等應(yīng)用的廣泛普及,“Token經(jīng)濟(jì)學(xué)”迅速在行業(yè)內(nèi)外走紅。
今年3月,中國(guó)Token日均調(diào)用量突破140萬(wàn)億大關(guān)。同月,英偉達(dá)年度盛會(huì)GTC 2026上,黃仁勛預(yù)言“未來(lái)的數(shù)據(jù)中心將轉(zhuǎn)變?yōu)樯a(chǎn)Token的工廠”,這與魔形智能的愿景不謀而合。3月底,在上海,徐凌杰分享了魔形智能的目標(biāo)愿景與業(yè)務(wù)模式,并從“局內(nèi)人”視角,剖析了Token工廠、Token經(jīng)濟(jì)學(xué)以及電力出海等概念背后的真相。
徐凌杰的創(chuàng)業(yè)選擇,源于對(duì)行業(yè)趨勢(shì)的敏銳洞察。他曾在英偉達(dá)、AMD、三星北美研究院從事GPU研發(fā)與管理工作,并擔(dān)任阿里巴巴阿里云智能事業(yè)群總監(jiān)。2019年壁仞科技成立后,他作為聯(lián)合創(chuàng)始人,負(fù)責(zé)產(chǎn)品規(guī)劃與市場(chǎng)拓展。2024年,壁仞多款產(chǎn)品進(jìn)入量產(chǎn)階段,營(yíng)收快速增長(zhǎng),同年9月還啟動(dòng)了上市輔導(dǎo)。然而,徐凌杰卻選擇在這個(gè)關(guān)鍵時(shí)刻離職創(chuàng)業(yè)。
對(duì)于創(chuàng)業(yè)時(shí)機(jī),徐凌杰表示,他和聯(lián)合創(chuàng)始人金琛看到,在AI大模型與芯片之間,存在大量工作待完成。2024年他40歲,認(rèn)為人生的黃金年齡有限,既然預(yù)見(jiàn)到Token大潮即將來(lái)臨,便決定抓住機(jī)遇,勇敢嘗試。讓他看清這一趨勢(shì)的,有兩件關(guān)鍵事件。
一是2024年GTC大會(huì)上,英偉達(dá)發(fā)布的GB200 NVL72。這是一個(gè)集成了36個(gè)Grace CPU、72個(gè)Blackwell GPU,擁有60萬(wàn)個(gè)零件、重達(dá)3000磅的“超節(jié)點(diǎn)(SuperPod)”機(jī)架系統(tǒng),代表了英偉達(dá)“超節(jié)點(diǎn)”產(chǎn)品路線。二是同年5月,開(kāi)源模型DeepSeek V2發(fā)布,憑借MoE(混合專家模型)、MLA(多頭潛注意力)等技術(shù),將模型推理成本降至行業(yè)最低,每百萬(wàn)Token成本相比同年發(fā)布的GPT-5降低約96%。算力以“超節(jié)點(diǎn)”形式極致堆疊,模型通過(guò)結(jié)構(gòu)創(chuàng)新壓縮單位Token成本,供給與效率同時(shí)躍遷,使Token具備了工業(yè)化生產(chǎn)、精細(xì)化定價(jià)的可能性。
徐凌杰將魔形智能定位為“軟硬件協(xié)同的AI Infra”。在寫給壁仞同事的離職信中,他提到雖告別造芯之路,但仍將堅(jiān)守智能算力賽道。當(dāng)時(shí)外界對(duì)此感到困惑,因?yàn)樵诤荛L(zhǎng)一段時(shí)間里,AI三要素“算力、算法和數(shù)據(jù)”是理解AI公司市場(chǎng)定位的坐標(biāo)系,芯片公司常被視為算力的代表。
在徐凌杰看來(lái),Token工廠與數(shù)據(jù)中心、智算中心有顯著差異。借用黃仁勛提出的五層蛋糕理論,Token將能源、芯片、infra、大模型封裝在一起,更貼近生活,消費(fèi)者對(duì)Token作為購(gòu)買智力單元已有感知。此前行業(yè)關(guān)注算力中心落成、千卡/萬(wàn)卡集群打造,主要因產(chǎn)業(yè)處于模型訓(xùn)練階段,模型未被廣泛使用。2025年DeepSeek V3爆發(fā)后,眾多應(yīng)用涌現(xiàn),推理相比訓(xùn)練未來(lái)成長(zhǎng)性更高,這是經(jīng)濟(jì)效益再分配過(guò)程,如今很多公司已給工程師配額Token用于生產(chǎn)。
對(duì)于魔形智能的位置,徐凌杰表示,市場(chǎng)對(duì)更快、智力更高、更大規(guī)模生產(chǎn)的Token有需求,這需要更大集群。中國(guó)存在大量?jī)?yōu)質(zhì)開(kāi)源模型,當(dāng)模型統(tǒng)一開(kāi)源后,未來(lái)需關(guān)注如何更好組織硬件、讓模型運(yùn)行更佳,這是Infra的工作。魔形智能對(duì)標(biāo)Nebius,但走得更深、全棧自研。Nebius部分服務(wù)器自研,通過(guò)改配統(tǒng)一配置提高穩(wěn)定性,降低故障中斷率,使模型訓(xùn)練更快。魔形智能強(qiáng)調(diào)軟硬件都要做,而目前大部分Infra企業(yè)仍以軟件方式運(yùn)營(yíng)。
當(dāng)被問(wèn)及如何衡量Token工廠性能時(shí),徐凌杰提出“用多少電,產(chǎn)生多少Token”的指標(biāo),這與黃仁勛“誰(shuí)的每瓦Token吞吐量最高,誰(shuí)的生產(chǎn)成本就最低”的觀點(diǎn)一致。電力決定裝機(jī)量上限,進(jìn)而決定每天生產(chǎn)Token數(shù)量,但不同品牌、型號(hào)芯片性能不均等,模型能力不同,產(chǎn)生的Token智力也不同,參數(shù)量越大的模型Token越聰明,生產(chǎn)效率也更高。對(duì)于Token單位電力吞吐量,徐凌杰認(rèn)為可關(guān)注芯片性能升級(jí)、超節(jié)點(diǎn)升級(jí)以及計(jì)算格式不同等變量條件。
談及英偉達(dá)在Token工廠范疇的地位,徐凌杰表示英偉達(dá)仍是技術(shù)極限的追求者和定義者,其文化推動(dòng)員工追求“speed of light”(光速)這一極限指標(biāo)。當(dāng)前市場(chǎng)比拼絕對(duì)性能和單位性價(jià)比,對(duì)中國(guó)公司而言,追求單位性價(jià)比更為重要。
對(duì)于建立Token工廠的要素,徐凌杰認(rèn)為長(zhǎng)期要走向超節(jié)點(diǎn)系統(tǒng)化工程,現(xiàn)階段可優(yōu)化運(yùn)營(yíng)成本,搞定硬件、掌握供應(yīng)鏈關(guān)鍵環(huán)節(jié)。目前中國(guó)每秒產(chǎn)生的Token(TPS)大概在30到60個(gè),美國(guó)可能達(dá)到100、200,主要受限于算力供給。當(dāng)被問(wèn)及魔形智能是否會(huì)自研芯片時(shí),徐凌杰表示這相對(duì)遙遠(yuǎn),不在當(dāng)前規(guī)劃中,魔形智能面向提供Token,服務(wù)器、集群是副產(chǎn)品。
面對(duì)國(guó)內(nèi)AI Infra賽道的競(jìng)爭(zhēng),徐凌杰認(rèn)為市場(chǎng)尚未到互相競(jìng)爭(zhēng)階段,AI Infra市場(chǎng)盤子比芯片更大,但資本投入遠(yuǎn)未達(dá)到芯片賽道程度,大家面對(duì)的是百倍千倍的成長(zhǎng)機(jī)會(huì),三年后賽道可能跑出千億級(jí)別人民幣以上的公司,且不止一家。對(duì)于AI Infra的商業(yè)模式,徐凌杰表示目前魔形智能更接近與算力中心合作,用他們的機(jī)器生產(chǎn)Token,未來(lái)算力消納模式可能是擴(kuò)大資源的一種方式。而對(duì)于“token出海”“電力出海”概念,徐凌杰認(rèn)為電力成本在Token成本中占比不到10%,算力成本才是核心,當(dāng)前中國(guó)算力無(wú)優(yōu)勢(shì),算力都不夠用,未來(lái)隨著芯片水平提高,這種愿景或許可能實(shí)現(xiàn),但目前并非現(xiàn)實(shí)命題。























