春節(jié)期間,人工智能領(lǐng)域迎來一場“多模態(tài)盛宴”,字節(jié)跳動憑借其多款大模型升級,成為行業(yè)焦點。2月14日,字節(jié)火山引擎正式推出豆包大模型2.0(Doubao-Seed-2.0),這是該模型自2024年5月首次發(fā)布以來的首次重大版本更新。作為多模態(tài)智能體模型,豆包2.0在視覺理解、復(fù)雜指令執(zhí)行和推理靈活性三大核心能力上實現(xiàn)突破,標(biāo)志著字節(jié)跳動在AI技術(shù)領(lǐng)域的進一步領(lǐng)先。
豆包大模型2.0的升級亮點顯著。在視覺與多模態(tài)理解方面,模型強化了對復(fù)雜文檔、表格、圖形和視頻內(nèi)容的解析能力,視覺信息處理精準(zhǔn)度大幅提升。例如,在測試中,當(dāng)輸入一張包含多種花卉的蛋糕圖片并詢問玫瑰數(shù)量及顏色時,模型不僅準(zhǔn)確識別出三類玫瑰花色,還指出其中一朵為洋桔梗,未受問題誤導(dǎo)。在復(fù)雜指令執(zhí)行方面,豆包2.0優(yōu)化了對多約束、長鏈路任務(wù)的理解與執(zhí)行能力,為高價值任務(wù)提供技術(shù)支撐。模型提供Pro、Lite、Mini三款通用Agent模型及專用Code模型,滿足不同場景需求,推理速度與靈活性顯著增強。
在豆包2.0發(fā)布前兩日,字節(jié)跳動已連續(xù)推出兩款重磅模型:2月12日發(fā)布的視頻生成模型Seedance 2.0和2月13日上線的圖像創(chuàng)作模型Seedream 5.0 Lite。Seedance 2.0以“1分鐘生成好萊塢級大片”的效果引發(fā)全球關(guān)注,其支持用戶通過詳細提示詞或參考圖片生成帶原生音頻的多鏡頭序列視頻,被影視從業(yè)者譽為“導(dǎo)演級AI”。例如,輸入“第一次華山論劍中大熊貓與大猩猩切磋武藝”的提示詞后,模型迅速生成媲美動漫電影的15秒視頻。知名導(dǎo)演賈樟柯在微博表示將用其制作短片,進一步印證其行業(yè)影響力。
Seedream 5.0 Lite則聚焦實用性,通過跨模態(tài)理解能力降低創(chuàng)作門檻。用戶無需復(fù)雜提示詞,僅需上傳參考圖并簡單描述需求,模型即可生成目標(biāo)風(fēng)格圖片。例如,輸入兩張圖片并要求“將圖1色調(diào)改為圖2”,模型能精準(zhǔn)理解并輸出符合要求的第三張圖片。該模型支持實時檢索,可基于最新數(shù)據(jù)生成圖表,如繪制指定日期的金價走勢圖,為金融、設(shè)計等領(lǐng)域提供高效工具。
豆包系列模型的升級不僅推動技術(shù)進步,更引發(fā)產(chǎn)業(yè)鏈連鎖反應(yīng)。在應(yīng)用層面,短視頻營銷、電商素材、AI漫劇、游戲制作等領(lǐng)域需求有望爆發(fā)。華泰證券研報指出,AI技術(shù)降低了文字IP向視頻轉(zhuǎn)化的門檻,擁有海量IP儲備的公司將直接受益,上游IP方數(shù)字資產(chǎn)價值或重估;中游制作方中,能高效結(jié)合AI工具的公司更具競爭力,尤其是擁有稀缺導(dǎo)演或編劇資源的團隊。同時,算力需求隨模型落地激增,AI芯片、智能服務(wù)器及云計算服務(wù)等上游環(huán)節(jié)有望快速增長。
字節(jié)跳動通過火山引擎對外提供豆包大模型服務(wù),成為其產(chǎn)業(yè)落地的核心平臺。數(shù)據(jù)顯示,截至2025年12月,豆包大模型日均使用量突破63萬億Tokens,居中國第一、全球第三;2025年上半年,火山引擎在中國公有云大模型調(diào)用量市場份額占比達49.2%。此次升級將進一步鞏固其AI云市場領(lǐng)先地位,加速AI技術(shù)在千行百業(yè)的深度應(yīng)用。













