阿里ATH創(chuàng)新事業(yè)部近日宣布,其最新研發(fā)的視頻生成與編輯模型HappyHorse 1.0(中文名:快樂小馬)正式開啟灰度測試。創(chuàng)作者可通過阿里云百煉平臺(tái)和HappyHorse官網(wǎng)注冊使用,普通用戶則能在千問App中搶先體驗(yàn)這一創(chuàng)新工具。
在盲測平臺(tái)Arena.ai的最新評測中,HappyHorse 1.0在文生視頻、圖生視頻和視頻編輯三個(gè)核心榜單上均位列第二,緊隨近期備受關(guān)注的字節(jié)Seedance 2.0之后。為全面評估其性能,相關(guān)團(tuán)隊(duì)進(jìn)行了多維度實(shí)測,發(fā)現(xiàn)該模型在指令遵循和生成速度方面表現(xiàn)突出,但在畫面物理準(zhǔn)確性和音畫同步等方面仍有改進(jìn)空間。
HappyHorse 1.0的操作十分便捷,用戶只需輸入文字描述,即可生成3至15秒的視頻,支持多鏡頭切換和連貫劇情。官網(wǎng)信息顯示,該模型最高支持1080p分辨率,可同時(shí)生成4個(gè)視頻。價(jià)格方面,生成720p和1080p視頻的基準(zhǔn)價(jià)格分別為每秒0.9元和1.6元,Pro套餐在限時(shí)折扣后為每秒0.44元和0.78元。
該模型已集成到阿里旗下多款產(chǎn)品中,包括阿里悟空、MuleRun和JVS Claw等Agent平臺(tái)。千問App還預(yù)告將推出“測一測”功能,用戶可測出自己在短劇宇宙中的角色,并通過HappyHorse 1.0生成自己“出演”的短劇片段。
實(shí)測過程中,HappyHorse 1.0展現(xiàn)了多項(xiàng)優(yōu)勢。其生成速度較快,一段視頻約需2至5分鐘,在同類模型中頗具競爭力。它還能準(zhǔn)確理解并執(zhí)行復(fù)雜的提示詞,包括鏡頭運(yùn)動(dòng)、畫面構(gòu)圖和風(fēng)格氛圍等要求。在圖生視頻中,該模型對人物、場景和道具等參考元素的還原度較高。不過,測試也發(fā)現(xiàn)了一些不足,如樂器演奏等復(fù)雜場景中,手部動(dòng)作與音頻節(jié)奏存在錯(cuò)位;10秒以上的視頻中,偶爾會(huì)出現(xiàn)物體無外力移動(dòng)等物理錯(cuò)誤;畫面中的文字渲染也常出現(xiàn)亂碼或錯(cuò)誤。
在文生視頻測試中,HappyHorse 1.0成功完成了多個(gè)復(fù)雜任務(wù)。例如,在街頭音樂表演的場景中,模型生成的人像肢體正常,鏡頭運(yùn)動(dòng)和燈光效果符合提示詞要求,但吉他手的演奏與音樂節(jié)奏不同步。在海邊懸崖的場景中,模型較好地模擬了水體和風(fēng)的動(dòng)態(tài)效果,但近景中水滴滑落速度略顯緩慢。在長達(dá)800詞的超長提示詞測試中,模型準(zhǔn)確呈現(xiàn)了畫面中的幾乎所有元素,但開頭出現(xiàn)車門無故關(guān)閉的物理錯(cuò)誤,結(jié)尾主角形象也發(fā)生了變化。
圖生視頻測試中,HappyHorse 1.0支持最多9張參考圖。在測試中,模型成功生成了OpenAI聯(lián)合創(chuàng)始人薩姆·奧爾特曼喝咖啡的畫面,人物相似度達(dá)八成。在馬斯克與奧爾特曼“對簿公堂”的場景中,模型雖能生成英語爭論畫面,但人物表情與參考圖存在偏差。在離職場景測試中,模型準(zhǔn)確呈現(xiàn)了所有參考元素,但出現(xiàn)了紙箱自動(dòng)合上等物理錯(cuò)誤。
業(yè)內(nèi)人士對HappyHorse 1.0的表現(xiàn)給予了不同評價(jià)。出海一站式AI電商營銷平臺(tái)麥斯國際的技術(shù)合伙人李明認(rèn)為,該模型的3至15秒生成長度、較快速度和支持1080p分辨率是亮點(diǎn),但在一致性和語音機(jī)械感方面仍有提升空間。他指出,文字渲染和音畫同步是當(dāng)前AI視頻生成模型的普遍問題,可通過后期工具和提示詞工程改善。AI視頻創(chuàng)作平臺(tái)FLOVA團(tuán)隊(duì)則認(rèn)為,HappyHorse 1.0在真實(shí)感和敘事能力上表現(xiàn)不錯(cuò),鏡頭運(yùn)動(dòng)自然,適合敘事性內(nèi)容和紀(jì)錄片風(fēng)格題材。





















