谷歌再次在人工智能領(lǐng)域掀起波瀾,其旗下DeepMind團隊推出的世界模型Genie 3實驗性研究原型「Project Genie」正式向公眾開放。這一創(chuàng)新項目允許用戶創(chuàng)建、編輯并探索虛擬世界,標志著交互式環(huán)境生成技術(shù)邁入新階段。
作為通用世界模型Genie 3的延伸,Project Genie整合了圖像生成與編輯模型Nano Banana Pro和語言模型Gemini的技術(shù)優(yōu)勢。用戶可通過文本描述或上傳圖片創(chuàng)建動態(tài)環(huán)境,定義角色行為模式——從步行、騎行到飛行均可實現(xiàn)。系統(tǒng)特別引入"世界草繪"功能,允許用戶在進入虛擬場景前預覽并調(diào)整視覺效果,甚至切換第一人稱或第三人稱視角。
該平臺的核心突破在于實時路徑生成技術(shù)。當用戶移動角色時,系統(tǒng)會根據(jù)交互行為動態(tài)延伸場景,這種突破性的一致性使機器人訓練、動畫制作乃至歷史場景重建成為可能。目前開放的功能包含三大模塊:環(huán)境創(chuàng)建、交互探索和內(nèi)容重混。用戶既能從零構(gòu)建虛擬世界,也可基于現(xiàn)有作品進行二次創(chuàng)作,最終生成的視頻內(nèi)容支持下載保存。
首批體驗的Google AI Ultra用戶已展示出驚人創(chuàng)造力。有人構(gòu)建出"法國女子攀越非邏輯世界"的奇幻場景,墻壁漂浮著飛行物體;另有用戶嘗試讓系統(tǒng)運行經(jīng)典游戲《毀滅戰(zhàn)士》,創(chuàng)造出嵌套式的屏幕迷宮。這些作品雖然存在物理模擬瑕疵——比如水獺飛行員頭頂鴨子、角色開門動作略顯僵硬——但已展現(xiàn)出技術(shù)潛力。
項目團隊坦言當前版本存在局限性:生成內(nèi)容時長限制在60秒內(nèi),部分預設(shè)功能如"提示事件"尚未開放,角色控制偶發(fā)延遲。但這些不足并未削弱技術(shù)社區(qū)的熱情,用戶在社交平臺分享的創(chuàng)作視頻已引發(fā)廣泛討論。隨著更多用戶參與測試,這個專注于沉浸式世界構(gòu)建的平臺有望持續(xù)進化,重新定義數(shù)字內(nèi)容的創(chuàng)作方式。













