谷歌Gemini 3發(fā)布即登頂：碾壓競品獲贊，憑TPU優(yōu)勢成AI新王者-天脈財經(jīng)

谷歌最新人工智能模型Gemini 3正式登場，一經(jīng)發(fā)布便在行業(yè)內(nèi)引發(fā)巨大反響。這款被谷歌首席執(zhí)行官桑達爾·皮查伊盛贊為“最智能模型”的產(chǎn)品，早在發(fā)布前就備受關(guān)注，如今終于揭開神秘面紗，展現(xiàn)出強大的實力。

與早期小步快跑的探索模式不同，Gemini 3的發(fā)布是一次全面且充分的展示。據(jù)Gemini團隊介紹，它不僅是全球領(lǐng)先的多模態(tài)理解模型，更是目前最強大的智能體和氛圍編程模型，其基礎(chǔ)是先進的推理能力。網(wǎng)友們在看到Gemini 3的評測表現(xiàn)后紛紛驚嘆，直言終于明白谷歌為何能成為股神巴菲特的“心頭好”。

Gemini 3的發(fā)布可謂不給競爭對手留機會，在各大評測集中表現(xiàn)卓越。它以1501分的成績強勢奪回LMArena大模型競技場榜首位置，超越了此前馬斯克xAI發(fā)布的Grok 4.1模型。從測試結(jié)果來看，Gemini 3 Pro憑借領(lǐng)先的推理能力和強大的多模態(tài)功能，性能顯著超越前一代的Gemini 2.5 Pro，對OpenAI的最新模型GPT - 5.1更是呈現(xiàn)出“碾壓”態(tài)勢。

在“人類終極考試”中，Gemini 3 Pro未使用任何工具，得分率就達到了37.5%；在GPQA Diamond基準測試中，準確率高達91.9%；在“地獄模式”數(shù)學(xué)測試MathArena Apex中，以23.4%的成績達到最先進水平，為數(shù)學(xué)領(lǐng)域的前沿模型樹立了新標桿。除了文本能力，Gemini 3 Pro在MMMU - Pro上取得81%的成績，在Video - MMMU上達到87.6%，在SimpleQA Verified基準測試中也獲得了72.1%的當前最先進得分，展現(xiàn)出在事實準確性方面的顯著進步，具備解決跨越科學(xué)和數(shù)學(xué)等廣泛主題復(fù)雜問題的能力。在AI界的圖靈測試“ARC - AGI - 2”中，Gemini 3 Pro拿下31.1%的高分，遠超GPT - 5.1的17.6%，這表明AI開始展現(xiàn)出類似人類的智力和思維方式，能在未見過的任務(wù)模式下進行推理。

Gemini 3的出色表現(xiàn)也得到了行業(yè)大佬的認可。OpenAI聯(lián)合創(chuàng)始人、CEO山姆·奧特曼發(fā)推評價“Gemini 3看起來很不錯”，xAI創(chuàng)始人、CEO埃隆·馬斯克也表示“干得很好”。

即日起，Gemini全面融入谷歌的產(chǎn)品生態(tài)，這也是谷歌首次在產(chǎn)品發(fā)布當日就將Gemini引入搜索領(lǐng)域。同時，Gemini 3同步向Gemini app用戶、AI Studio和Vertex AI的開發(fā)者，以及全新的智能體開發(fā)平臺Google Antigravity推出，彰顯出谷歌用AI定義整個生態(tài)每個支點的平臺級野心。

本次發(fā)布的Gemini 3 Pro深度思考版本模型雖尚未全面開放，但從測試表現(xiàn)可知其Benchmark水平比Gemini 3 Pro高出一個數(shù)量級。谷歌表示，將在未來幾周向Google AI Ultra訂閱者開放，目前該模型還在進行安全評估。

Gemini 3的功能十分強大且多樣。它可以編寫代碼來可視化托卡馬克中的等離子體流動，還能創(chuàng)作詩歌捕捉聚變的物理原理。如果用戶想學(xué)習(xí)家族傳統(tǒng)菜肴，它能解讀并翻譯不同語言的手寫食譜，生成可分享的食譜。對于想學(xué)習(xí)新領(lǐng)域知識的用戶，把學(xué)術(shù)論文、講座視頻等素材提供給Gemini 3，它能生成交互式記憶卡片、可視化或其他格式的代碼，幫助用戶掌握相關(guān)知識。它還能充當教練角色，觀看打球運動視頻指出改進之處并生成訓(xùn)練計劃。在搜索模式下，使用Gemini 3可實現(xiàn)新的生成式UI體驗，如沉浸式視覺布局、交互式工具和模擬等。它還能編寫擁有豐富可視化界面和互動性的3D飛船游戲、可玩的科幻世界以及更具實用性的網(wǎng)頁等，令極客論壇上的前端開發(fā)者感嘆其不僅能高效寫代碼，還能理解審美，動畫效果恰到好處。

2025年，AI行業(yè)“模型即智能體”的熱潮席卷全球，大模型從被動的“預(yù)測引擎”升級為主動的“行動實體”，具備自主決策和執(zhí)行能力。然而，to C智能體產(chǎn)品普遍面臨“叫好不叫座”的困境，用戶體驗可靠好用的產(chǎn)品較少，這背后考驗的是基礎(chǔ)模型推理、工具運用與任務(wù)規(guī)劃的綜合實力。Gemini 3率先取得突破，成為第一個在模型界面融入通用Agent能力并支持執(zhí)行多種復(fù)雜任務(wù)的產(chǎn)品。其工具使用能力相比2.5 Pro提升了30%，不僅能更準確選擇正確工具，還能理解何時需要不同工具組合完成復(fù)雜任務(wù)。

此次發(fā)布中，谷歌還帶來了全新Agent開發(fā)平臺Google Antigravity。借助Gemini 3的高級推理、工具使用和智能編碼能力，Google Antigravity將AI輔助從開發(fā)者工具包中的工具轉(zhuǎn)變?yōu)榛钴S伙伴。雖然其核心仍沿用熟悉的AI集成開發(fā)環(huán)境（IDE），但智能體被提升到專屬界面，可直接訪問編輯器、終端和瀏覽器，能代表開發(fā)者自主規(guī)劃和執(zhí)行復(fù)雜的端到端軟件任務(wù)，并自行驗證代碼。

谷歌還提到，Gemini 3是迄今為止最安全的模型，接受了Google AI模型中最全面的一套安全評估，展現(xiàn)出更低的諂媚性、更高的抗提示注入能力，并強化了抵御網(wǎng)絡(luò)攻擊濫用的保護措施。值得一提的是，Gemini 3的訓(xùn)練完全基于自家TPU，在全球AI公司等待英偉達GPU發(fā)貨時，谷歌有肆意擴張參數(shù)的底氣。隨著Gemini 3加入模型“角斗場”，谷歌宣告王者歸來，圍繞大模型的新一輪競爭已全面打響。