在人工智能技術競爭愈發激烈的當下,谷歌在年度開發者大會上宣布推出Gemini 3.5系列模型,并展示了一款新型物理世界模擬AI模型。這一舉措被視為谷歌在模型開發領域保持領先地位的重要布局,同時也為其龐大的用戶群體提供了更多AI智能服務選項。
此次發布的Gemini 3.5系列中,輕量級產品Gemini 3.5 Flash成為焦點。谷歌首席執行官桑達爾·皮查伊介紹稱,該模型在保持尖端能力的同時,成本僅為同類頂尖模型的一半,部分場景下甚至不到三分之一,且響應速度極快。谷歌已決定將其設為全球Gemini應用和搜索AI模式的默認模型,并強調用戶無需在質量與速度之間做出妥協。公司通過強化網絡安全防護,使該模型生成有害內容的概率顯著降低,同時減少了因安全問題拒絕回答的情況。
重量級版本Gemini 3.5 Pro目前仍處于內部測試階段,預計下個月向更廣泛的用戶開放。皮查伊表示,谷歌正致力于將智能體技術從開發者與企業端擴展至消費者市場,確保前沿能力以安全可靠的方式惠及更多人群。這一戰略調整與谷歌近期資本支出上升的背景密切相關,華爾街正密切關注其能否通過產品深度整合實現商業價值,智能代理功能被視為關鍵突破口。
另一款引人注目的產品是Gemini Omni——一款專注于物理環境模擬的世界模型。該模型可精準預測用戶操作后的場景變化,在重力、流體動力學等物理特性模擬方面表現突出。谷歌DeepMind首席AI架構師Koray Kavukcuoglu稱,Omni不僅能生成高質量視頻,還允許用戶在生成后與內容進行互動,為學習與探索提供了類似教程的功能。例如,用戶可編輯視頻中的動作、添加新角色或物體,甚至改變正在發生的事件。
目前,Omni已集成至Gemini Flash、Gemini應用、Google Flow及YouTube Shorts等平臺,支持圖像與音頻功能。谷歌在技術文檔中舉例說明,用戶可通過簡單指令讓Omni修改視頻中的場景細節,生成更逼真的圖像效果。這一能力突破了傳統AI工具在視頻生成領域的局限,盡管其對計算資源的需求仍高于文本或圖像模型。
行業觀察人士指出,谷歌此次發布的產品組合直指當前AI市場的核心痛點:成本、速度與實用性。尤其在視頻生成領域,OpenAI今年早些時候因算力分配問題放棄Sora項目,而谷歌選擇持續投入,顯示出其對技術突破的堅定信心。與此同時,Anthropic近期發布的Mythos模型因能發現全球軟件基礎設施中的未知漏洞而備受關注,進一步加劇了AI領域的競爭態勢。






















