在全球AI視頻生成領(lǐng)域,一場技術(shù)競賽正悄然升溫。一款名為HappyHorse-1.0的開源模型以黑馬姿態(tài)橫空出世,不僅在Artificial Analysis視頻競技場排行榜上力壓群雄,更以原生音視頻聯(lián)合生成能力引發(fā)行業(yè)震動。該模型在文本生成視頻(含/不含音頻)、圖片生成視頻(含/不含音頻)四大賽道全面登頂,其中圖片生成視頻(不含音頻)賽道以1413分刷新紀(jì)錄,較第二名高出110分。
技術(shù)突破成為HappyHorse的核心競爭力。作為全球首個原生支持音視頻聯(lián)合生成的開源模型,其150億參數(shù)規(guī)模搭配40層統(tǒng)一自注意力Transformer架構(gòu),在單張H100顯卡上生成5秒1080p視頻僅需38秒。更引人注目的是其多語言唇形同步能力,可精準(zhǔn)匹配英語、普通話、粵語、日語、韓語、德語、法語七種語言的發(fā)音口型,詞錯誤率在同類開源模型中達(dá)到最低水平。這種技術(shù)優(yōu)勢使其在短視頻創(chuàng)作、影視特效等場景具備顯著應(yīng)用潛力。
追蹤模型發(fā)展脈絡(luò)可見,HappyHorse的研發(fā)團(tuán)隊來自阿里巴巴生態(tài)體系。該項(xiàng)目最初由淘天集團(tuán)未來生活實(shí)驗(yàn)室張迪團(tuán)隊主導(dǎo),隨著組織架構(gòu)調(diào)整,該實(shí)驗(yàn)室已劃歸新成立的ATH事業(yè)群AI創(chuàng)新事業(yè)部。這個由阿里CEO吳泳銘親自掛帥的戰(zhàn)略單元,整合了通義實(shí)驗(yàn)室、MaaS業(yè)務(wù)線等五大核心板塊,明確以"創(chuàng)造Token、輸送Token、應(yīng)用Token"為發(fā)展目標(biāo)。4月8日的技術(shù)委員會成立及通義實(shí)驗(yàn)室升級,進(jìn)一步凸顯阿里在AI領(lǐng)域的資源傾斜力度。
商業(yè)化布局同步提速。阿里云銷售團(tuán)隊已啟動AI短劇、漫劇客戶的拓展工作,試圖在視頻生成行業(yè)商業(yè)化關(guān)鍵期搶占先機(jī)。高盛研究報告顯示,該領(lǐng)域市場規(guī)模將從2025年的30億美元激增至2030年的290億美元,五年增長近十倍。面對字節(jié)跳動Seedance 2.0、快手可靈3.0等已占據(jù)市場高地的競爭對手,HappyHorse的開源策略或?qū)⒊蔀槠凭株P(guān)鍵——通過降低技術(shù)使用門檻,快速構(gòu)建開發(fā)者生態(tài)。
行業(yè)格局正經(jīng)歷深刻變化。HappyHorse的崛起不僅標(biāo)志著視頻生成技術(shù)進(jìn)入新階段,更使國產(chǎn)模型競爭白熱化。當(dāng)前頭部陣營中,字節(jié)跳動、昆侖萬維、愛詩科技等企業(yè)已形成梯隊優(yōu)勢,阿里的強(qiáng)勢入局被視為攪動市場的"鯰魚效應(yīng)"。隨著各家陸續(xù)公布技術(shù)路線圖,2024年或?qū)⒊蔀橐曨l生成模型從實(shí)驗(yàn)室走向產(chǎn)業(yè)應(yīng)用的關(guān)鍵轉(zhuǎn)折點(diǎn)。












