真实夫妻露脸自拍视频在线播放-亚洲精品乱码久久久久久蜜月-免费动漫成人av在线观看-中文字幕av三区三级爽-日韩熟女人妻一区二区-亚洲欧美乱日韩乱国产-一二三四区中文字幕在线-国产美女香蕉久久精品-久久视频在线播放视频

智能體深度應(yīng)用詞元消耗激增 降本增效路在何方?

   時(shí)間:2026-04-04 05:15 來源:快訊作者:北青網(wǎng)

隨著人工智能技術(shù)在各領(lǐng)域的滲透,關(guān)于大模型使用中Token消耗與成本控制的討論日益成為焦點(diǎn)。Token作為大模型處理信息的最小單元,無論是日常提問還是生成內(nèi)容,每一次交互都伴隨著它的消耗。近期,智能體應(yīng)用如“龍蝦”的興起,進(jìn)一步推高了Token的使用需求,也讓成本問題愈發(fā)凸顯。

記者調(diào)查發(fā)現(xiàn),智能體產(chǎn)品落地初期,簡單交互場景的成本變化并不顯著,但深度使用場景中,Token消耗量會(huì)呈指數(shù)級(jí)增長,直接推高使用成本。個(gè)人用戶秦先生表示:“任務(wù)復(fù)雜度稍有提升,成本就明顯增加,Token消耗與任務(wù)難度不成正比,超出預(yù)期。”企業(yè)層面的感受更為強(qiáng)烈——規(guī)?;瘧?yīng)用AI的企業(yè)日均Token消耗已達(dá)百億級(jí),以中交AI中心為例,其開發(fā)的數(shù)千個(gè)智能體日均消耗上百億Token,對(duì)應(yīng)成本約十萬元。

持續(xù)增長的Token需求對(duì)算力系統(tǒng)構(gòu)成挑戰(zhàn)。MiniMax稀宇科技副總裁嚴(yán)奕駿透露,公司每周都要進(jìn)行算力擴(kuò)容,算力資源始終處于“緊平衡”狀態(tài)。中國電信北京公司AI技術(shù)負(fù)責(zé)人陳哲詩觀察到,大模型技術(shù)演進(jìn)拉動(dòng)了應(yīng)用層需求,算力租賃市場火爆,但客戶對(duì)成本敏感度較高,優(yōu)化基礎(chǔ)設(shè)施效率、降低Token成本成為行業(yè)共同訴求。

Token與手機(jī)流量的計(jì)費(fèi)邏輯本質(zhì)不同。手機(jī)流量按傳輸量計(jì)費(fèi),緩存內(nèi)容可重復(fù)使用,成本清晰可控;而Token作為AI處理信息的計(jì)量單位,用戶需支付模型空間占用費(fèi)、服務(wù)套餐費(fèi),每條指令執(zhí)行都會(huì)產(chǎn)生實(shí)時(shí)消耗,功能擴(kuò)展或權(quán)限開放還會(huì)帶來額外支出。這種差異導(dǎo)致深度使用場景下,Token成本增長遠(yuǎn)高于流量成本。

降低Token成本已成為行業(yè)共識(shí)。中國信息通信研究院云計(jì)算與數(shù)字化研究所主任馬飛分析,當(dāng)前成本偏高源于行業(yè)處于發(fā)展初期,高端算力硬件成本高、資源利用率不足等多重因素疊加。隨著技術(shù)成熟和算力供給優(yōu)化,單位Token成本將逐步下降,需求爆發(fā)也將倒逼產(chǎn)業(yè)加速迭代。

企業(yè)正在通過多路徑降本。月之暗面Kimi企業(yè)業(yè)務(wù)負(fù)責(zé)人黃震昕表示,公司通過底層模型架構(gòu)創(chuàng)新提升效率,直接降低Token成本;階躍星辰首席技術(shù)官朱亦博提出“智價(jià)比”概念,強(qiáng)調(diào)在保持模型智力水平的同時(shí)盡可能壓縮成本。云服務(wù)機(jī)構(gòu)則從資源配置入手,天翼云智算平臺(tái)產(chǎn)品專家王曼介紹,通過算電協(xié)同、算網(wǎng)融合調(diào)度等技術(shù),持續(xù)優(yōu)化成本結(jié)構(gòu)。

國家層面算力布局為普惠化提供支撐。中國信通院發(fā)布的《算力互聯(lián)網(wǎng)體系架構(gòu)研究報(bào)告》顯示,我國智能算力規(guī)模已居全球第二,但高端算力、核心算法仍存在外部依賴。當(dāng)前,全國一體化算力網(wǎng)絡(luò)建設(shè)加速推進(jìn),通過統(tǒng)一調(diào)度優(yōu)化資源配置,算力服務(wù)可觸達(dá)性顯著提升。同時(shí),輕量化、低功耗本土大模型的發(fā)展,讓更多普通用戶能夠以較低成本享受AI服務(wù)。

中國信通院云計(jì)算與數(shù)字化研究所副所長栗蔚認(rèn)為,Token作為AI產(chǎn)業(yè)度量衡,其消耗總量反映應(yīng)用深度,成本則體現(xiàn)算法算力效率。要實(shí)現(xiàn)Token普惠化,需構(gòu)建優(yōu)質(zhì)算法、持續(xù)優(yōu)化模型,降低單Token算力消耗,并搭建隨需接入的算力節(jié)點(diǎn)網(wǎng)絡(luò),讓AI服務(wù)真正走進(jìn)千家萬戶。

 
 
更多>同類天脈資訊
全站最新
熱門內(nèi)容
媒體信息
新傳播周刊
新傳播,傳播新經(jīng)濟(jì)之聲!
網(wǎng)站首頁  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)隱私  |  RSS訂閱  |  違規(guī)舉報(bào) 魯公網(wǎng)安備37010202700497號(hào)