谷歌最新人工智能模型Gemini 3正式登場,一經(jīng)發(fā)布便在行業(yè)內(nèi)引發(fā)巨大反響。這款被谷歌首席執(zhí)行官桑達爾·皮查伊盛贊為“最智能模型”的產(chǎn)品,早在發(fā)布前就備受關(guān)注,如今終于揭開神秘面紗,展現(xiàn)出強大的實力。
與早期小步快跑的探索模式不同,Gemini 3的發(fā)布是一次全面且充分的展示。據(jù)Gemini團隊介紹,它不僅是全球領(lǐng)先的多模態(tài)理解模型,更是目前最強大的智能體和氛圍編程模型,其基礎(chǔ)是先進的推理能力。網(wǎng)友們在看到Gemini 3的評測表現(xiàn)后紛紛驚嘆,直言終于明白谷歌為何能成為股神巴菲特的“心頭好”。
Gemini 3的發(fā)布可謂不給競爭對手留機會,在各大評測集中表現(xiàn)卓越。它以1501分的成績強勢奪回LMArena大模型競技場榜首位置,超越了此前馬斯克xAI發(fā)布的Grok 4.1模型。從測試結(jié)果來看,Gemini 3 Pro憑借領(lǐng)先的推理能力和強大的多模態(tài)功能,性能顯著超越前一代的Gemini 2.5 Pro,對OpenAI的最新模型GPT - 5.1更是呈現(xiàn)出“碾壓”態(tài)勢。
在“人類終極考試”中,Gemini 3 Pro未使用任何工具,得分率就達到了37.5%;在GPQA Diamond基準測試中,準確率高達91.9%;在“地獄模式”數(shù)學(xué)測試MathArena Apex中,以23.4%的成績達到最先進水平,為數(shù)學(xué)領(lǐng)域的前沿模型樹立了新標桿。除了文本能力,Gemini 3 Pro在MMMU - Pro上取得81%的成績,在Video - MMMU上達到87.6%,在SimpleQA Verified基準測試中也獲得了72.1%的當前最先進得分,展現(xiàn)出在事實準確性方面的顯著進步,具備解決跨越科學(xué)和數(shù)學(xué)等廣泛主題復(fù)雜問題的能力。在AI界的圖靈測試“ARC - AGI - 2”中,Gemini 3 Pro拿下31.1%的高分,遠超GPT - 5.1的17.6%,這表明AI開始展現(xiàn)出類似人類的智力和思維方式,能在未見過的任務(wù)模式下進行推理。
Gemini 3的出色表現(xiàn)也得到了行業(yè)大佬的認可。OpenAI聯(lián)合創(chuàng)始人、CEO山姆·奧特曼發(fā)推評價“Gemini 3看起來很不錯”,xAI創(chuàng)始人、CEO埃隆·馬斯克也表示“干得很好”。
即日起,Gemini全面融入谷歌的產(chǎn)品生態(tài),這也是谷歌首次在產(chǎn)品發(fā)布當日就將Gemini引入搜索領(lǐng)域。同時,Gemini 3同步向Gemini app用戶、AI Studio和Vertex AI的開發(fā)者,以及全新的智能體開發(fā)平臺Google Antigravity推出,彰顯出谷歌用AI定義整個生態(tài)每個支點的平臺級野心。
本次發(fā)布的Gemini 3 Pro深度思考版本模型雖尚未全面開放,但從測試表現(xiàn)可知其Benchmark水平比Gemini 3 Pro高出一個數(shù)量級。谷歌表示,將在未來幾周向Google AI Ultra訂閱者開放,目前該模型還在進行安全評估。
Gemini 3的功能十分強大且多樣。它可以編寫代碼來可視化托卡馬克中的等離子體流動,還能創(chuàng)作詩歌捕捉聚變的物理原理。如果用戶想學(xué)習(xí)家族傳統(tǒng)菜肴,它能解讀并翻譯不同語言的手寫食譜,生成可分享的食譜。對于想學(xué)習(xí)新領(lǐng)域知識的用戶,把學(xué)術(shù)論文、講座視頻等素材提供給Gemini 3,它能生成交互式記憶卡片、可視化或其他格式的代碼,幫助用戶掌握相關(guān)知識。它還能充當教練角色,觀看打球運動視頻指出改進之處并生成訓(xùn)練計劃。在搜索模式下,使用Gemini 3可實現(xiàn)新的生成式UI體驗,如沉浸式視覺布局、交互式工具和模擬等。它還能編寫擁有豐富可視化界面和互動性的3D飛船游戲、可玩的科幻世界以及更具實用性的網(wǎng)頁等,令極客論壇上的前端開發(fā)者感嘆其不僅能高效寫代碼,還能理解審美,動畫效果恰到好處。
2025年,AI行業(yè)“模型即智能體”的熱潮席卷全球,大模型從被動的“預(yù)測引擎”升級為主動的“行動實體”,具備自主決策和執(zhí)行能力。然而,to C智能體產(chǎn)品普遍面臨“叫好不叫座”的困境,用戶體驗可靠好用的產(chǎn)品較少,這背后考驗的是基礎(chǔ)模型推理、工具運用與任務(wù)規(guī)劃的綜合實力。Gemini 3率先取得突破,成為第一個在模型界面融入通用Agent能力并支持執(zhí)行多種復(fù)雜任務(wù)的產(chǎn)品。其工具使用能力相比2.5 Pro提升了30%,不僅能更準確選擇正確工具,還能理解何時需要不同工具組合完成復(fù)雜任務(wù)。
此次發(fā)布中,谷歌還帶來了全新Agent開發(fā)平臺Google Antigravity。借助Gemini 3的高級推理、工具使用和智能編碼能力,Google Antigravity將AI輔助從開發(fā)者工具包中的工具轉(zhuǎn)變?yōu)榛钴S伙伴。雖然其核心仍沿用熟悉的AI集成開發(fā)環(huán)境(IDE),但智能體被提升到專屬界面,可直接訪問編輯器、終端和瀏覽器,能代表開發(fā)者自主規(guī)劃和執(zhí)行復(fù)雜的端到端軟件任務(wù),并自行驗證代碼。
谷歌還提到,Gemini 3是迄今為止最安全的模型,接受了Google AI模型中最全面的一套安全評估,展現(xiàn)出更低的諂媚性、更高的抗提示注入能力,并強化了抵御網(wǎng)絡(luò)攻擊濫用的保護措施。值得一提的是,Gemini 3的訓(xùn)練完全基于自家TPU,在全球AI公司等待英偉達GPU發(fā)貨時,谷歌有肆意擴張參數(shù)的底氣。隨著Gemini 3加入模型“角斗場”,谷歌宣告王者歸來,圍繞大模型的新一輪競爭已全面打響。













