字節(jié)跳動旗下AI視頻生成工具Seedance2.0近日開啟小范圍內(nèi)部測試,其多模態(tài)交互能力與電影級畫面生成效果引發(fā)科技圈熱議。這款基于深度學(xué)習(xí)的新模型支持文本、圖片雙模態(tài)輸入,用戶可通過自然語言描述或參考圖像生成5至10秒的高清視頻片段。
在社交平臺流傳的測試案例中,Seedance2.0精準復(fù)現(xiàn)了1670年阿姆斯特丹的城市景觀,其歷史場景還原度顯著優(yōu)于同期谷歌發(fā)布的Genie3世界模型。有科技博主通過對比測試指出,該模型在建筑細節(jié)、光影效果和動態(tài)呈現(xiàn)方面展現(xiàn)出突破性進展,甚至能模擬不同季節(jié)的天氣變化。
特斯拉創(chuàng)始人馬斯克在社交媒體轉(zhuǎn)發(fā)了相關(guān)演示視頻,并評論稱:"AI視頻生成技術(shù)的迭代速度超出預(yù)期"。據(jù)內(nèi)部人士透露,Seedance2.0采用全新的時空注意力機制,在保持畫面連貫性的同時,將單次生成耗時壓縮至行業(yè)平均水平的三分之一。
目前該模型已全面接入字節(jié)跳動旗下豆包平臺,用戶可在APP、網(wǎng)頁端及PC客戶端體驗。操作界面新增"Seedance 2.0"專屬入口,輸入提示詞后系統(tǒng)會自動推薦最佳畫面參數(shù)。平臺還推出"數(shù)字分身"功能,通過3D掃描技術(shù)創(chuàng)建用戶虛擬形象,支持個性化視頻內(nèi)容創(chuàng)作。
技術(shù)文檔顯示,Seedance2.0支持4K分辨率輸出,幀率最高可達60fps。在文本理解方面,模型能準確解析復(fù)雜指令,例如"生成中世紀城堡被龍卷風(fēng)摧毀的慢鏡頭,畫面偏冷色調(diào)"。開發(fā)團隊表示,后續(xù)版本將增加更長視頻生成和音頻合成功能,進一步拓展創(chuàng)作邊界。













