谷歌發布Gemini 3.5系列模型及Omni世界模型推動AI應用與視頻生成新進展

發布時間：2026-05-20 09:58 來源：快訊作者：柳晴雪

在人工智能技術競爭愈發激烈的當下，谷歌在年度開發者大會上宣布推出Gemini 3.5系列模型，并展示了一款新型物理世界模擬AI模型。這一舉措被視為谷歌在模型開發領域保持領先地位的重要布局，同時也為其龐大的用戶群體提供了更多AI智能服務選項。

此次發布的Gemini 3.5系列中，輕量級產品Gemini 3.5 Flash成為焦點。谷歌首席執行官桑達爾·皮查伊介紹稱，該模型在保持尖端能力的同時，成本僅為同類頂尖模型的一半，部分場景下甚至不到三分之一，且響應速度極快。谷歌已決定將其設為全球Gemini應用和搜索AI模式的默認模型，并強調用戶無需在質量與速度之間做出妥協。公司通過強化網絡安全防護，使該模型生成有害內容的概率顯著降低，同時減少了因安全問題拒絕回答的情況。

重量級版本Gemini 3.5 Pro目前仍處于內部測試階段，預計下個月向更廣泛的用戶開放。皮查伊表示，谷歌正致力于將智能體技術從開發者與企業端擴展至消費者市場，確保前沿能力以安全可靠的方式惠及更多人群。這一戰略調整與谷歌近期資本支出上升的背景密切相關，華爾街正密切關注其能否通過產品深度整合實現商業價值，智能代理功能被視為關鍵突破口。

另一款引人注目的產品是Gemini Omni——一款專注于物理環境模擬的世界模型。該模型可精準預測用戶操作后的場景變化，在重力、流體動力學等物理特性模擬方面表現突出。谷歌DeepMind首席AI架構師Koray Kavukcuoglu稱，Omni不僅能生成高質量視頻，還允許用戶在生成后與內容進行互動，為學習與探索提供了類似教程的功能。例如，用戶可編輯視頻中的動作、添加新角色或物體，甚至改變正在發生的事件。

目前，Omni已集成至Gemini Flash、Gemini應用、Google Flow及YouTube Shorts等平臺，支持圖像與音頻功能。谷歌在技術文檔中舉例說明，用戶可通過簡單指令讓Omni修改視頻中的場景細節，生成更逼真的圖像效果。這一能力突破了傳統AI工具在視頻生成領域的局限，盡管其對計算資源的需求仍高于文本或圖像模型。

行業觀察人士指出，谷歌此次發布的產品組合直指當前AI市場的核心痛點：成本、速度與實用性。尤其在視頻生成領域，OpenAI今年早些時候因算力分配問題放棄Sora項目，而谷歌選擇持續投入，顯示出其對技術突破的堅定信心。與此同時，Anthropic近期發布的Mythos模型因能發現全球軟件基礎設施中的未知漏洞而備受關注，進一步加劇了AI領域的競爭態勢。

更多>同類內容