谷歌正在悄然推動(dòng)其AI助手Gemini從“對話伙伴”向“任務(wù)執(zhí)行者”轉(zhuǎn)型。近期,長期追蹤谷歌產(chǎn)品動(dòng)態(tài)的TestingCatalog網(wǎng)站發(fā)現(xiàn),Gemini界面中新增了一個(gè)名為“Agents”的一級入口,與現(xiàn)有的“Gems”和“Files”功能并列顯示。這一改動(dòng)被視為谷歌加速布局AI代理(Agent)生態(tài)的重要信號,預(yù)示著用戶未來可通過Gemini直接創(chuàng)建并管理自動(dòng)化任務(wù),而非僅限于對話交互。
根據(jù)曝光的功能界面,Gemini的“Agents”標(biāo)簽頁提供了“新建任務(wù)”和“收件箱”兩大核心入口。用戶創(chuàng)建任務(wù)時(shí),系統(tǒng)會展開一個(gè)結(jié)構(gòu)化工作區(qū),右側(cè)面板明確劃分了任務(wù)目標(biāo)、執(zhí)行代理、可連接的應(yīng)用程序以及所需文件等模塊。更引人注目的是,界面中新增了“需要人工審核”的開關(guān)選項(xiàng),允許用戶在自動(dòng)化流程中插入人工干預(yù)節(jié)點(diǎn)。這種設(shè)計(jì)使Gemini從單純的聊天工具轉(zhuǎn)變?yōu)榫邆淙蝿?wù)編排能力的智能工作臺,用戶可直接通過自然語言指令驅(qū)動(dòng)AI完成復(fù)雜操作。
支撐這一轉(zhuǎn)型的關(guān)鍵是谷歌推出的Agent Designer平臺。該平臺采用無代碼/低代碼設(shè)計(jì),允許用戶無需編程基礎(chǔ)即可創(chuàng)建單步驟或多步驟的自動(dòng)化流程。例如,用戶可編排一個(gè)包含子任務(wù)的復(fù)雜工作流,或設(shè)置定時(shí)觸發(fā)條件讓代理自主執(zhí)行。目前,該平臺已集成Gmail、Google Drive、Jira、GitHub等主流工具的連接器,并支持與Shopify等更多應(yīng)用的預(yù)覽對接。這種“拖拽式”任務(wù)編排方式顯著降低了AI代理的使用門檻,使非技術(shù)用戶也能快速構(gòu)建自動(dòng)化解決方案。
谷歌的轉(zhuǎn)型策略與其產(chǎn)品矩陣的深度整合密不可分。過去半年間,該公司通過多項(xiàng)舉措強(qiáng)化AI代理能力:將Agent Designer全面嵌入Gemini Enterprise企業(yè)版,為NotebookLM添加音頻生成和視頻摘要功能,將Agentspace整合為Gemini的核心引擎,并在Chrome瀏覽器中嵌入Gemini側(cè)邊欄實(shí)現(xiàn)網(wǎng)頁自動(dòng)瀏覽。這些動(dòng)作共同構(gòu)建了一個(gè)覆蓋辦公、搜索、開發(fā)等場景的AI代理生態(tài),而新增的“Agents”入口則標(biāo)志著該能力正式向普通用戶開放。
在AI代理領(lǐng)域,谷歌并非唯一參與者。Anthropic推出的Claude Cowork選擇另一條路徑:其桌面端代理可直接操作本地文件和應(yīng)用程序,通過截圖、鼠標(biāo)鍵盤交互等方式實(shí)現(xiàn)跨應(yīng)用任務(wù)執(zhí)行。這種“模型即代理”的設(shè)計(jì)強(qiáng)調(diào)原生能力,但缺乏谷歌的消費(fèi)級產(chǎn)品分發(fā)網(wǎng)絡(luò)。OpenAI則采取折中策略,通過GPT Store構(gòu)建第三方代理生態(tài),同時(shí)升級API支持更完整的開發(fā)框架。三家公司的競爭焦點(diǎn)已從模型性能轉(zhuǎn)向執(zhí)行效率與用戶觸達(dá)能力。
谷歌的競爭優(yōu)勢在于其龐大的用戶基礎(chǔ)和產(chǎn)品矩陣。通過將AI代理能力嵌入搜索、Workspace、Cloud等擁有數(shù)十億用戶的服務(wù),該公司可快速完成市場教育并建立使用習(xí)慣。相比之下,Anthropic需依賴開發(fā)者社區(qū)和高端用戶推動(dòng)Cowork的普及,而OpenAI則面臨生態(tài)活躍度不足的挑戰(zhàn)。隨著谷歌I/O大會臨近,業(yè)界普遍預(yù)期該公司將進(jìn)一步公開其AI代理戰(zhàn)略,這場關(guān)于“任務(wù)執(zhí)行權(quán)”的爭奪戰(zhàn)正進(jìn)入白熱化階段。













