真实夫妻露脸自拍视频在线播放-亚洲精品乱码久久久久久蜜月-免费动漫成人av在线观看-中文字幕av三区三级爽-日韩熟女人妻一区二区-亚洲欧美乱日韩乱国产-一二三四区中文字幕在线-国产美女香蕉久久精品-久久视频在线播放视频

谷歌發(fā)布Gemini Embedding 2模型:支持多模態(tài)數(shù)據(jù),簡化流程提升檢索精度

   時間:2026-03-11 22:15 來源:快訊作者:IT之家

谷歌近日宣布推出其首個原生多模態(tài)嵌入模型——Gemini Embedding 2,標(biāo)志著人工智能在跨模態(tài)數(shù)據(jù)處理領(lǐng)域邁出重要一步。該模型突破了傳統(tǒng)嵌入模型僅支持文本的局限,能夠同時處理文本、圖像、視頻、音頻和文檔五種數(shù)據(jù)類型,并將它們映射到統(tǒng)一的向量空間中,為機器理解復(fù)雜信息提供了全新工具。

與生成式AI模型如Gemini 3不同,嵌入模型的核心功能在于數(shù)據(jù)理解而非內(nèi)容創(chuàng)作。Gemini Embedding 2通過將非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)換為數(shù)學(xué)向量形式,使計算機能夠精準(zhǔn)捕捉語義關(guān)系。例如,在法律訴訟場景中,該模型可同時分析合同文本、監(jiān)控視頻和音頻證據(jù),快速定位關(guān)鍵信息。測試數(shù)據(jù)顯示,在處理數(shù)百萬條記錄時,多模態(tài)嵌入技術(shù)使檢索精度提升顯著,尤其在圖像和視頻搜索方面表現(xiàn)突出。

該模型支持100種語言的語義意圖識別,并設(shè)定了明確的數(shù)據(jù)處理規(guī)范:文本輸入上限為8192個token,圖像支持PNG/JPEG格式且單次最多處理6張,視頻輸入時長限制在120秒內(nèi)(支持MP4/MOV格式),音頻可直接處理無需轉(zhuǎn)錄,文檔則支持最多6頁的PDF文件。這種設(shè)計既保證了處理效率,又覆蓋了主流應(yīng)用場景的需求。

谷歌工程師透露,Gemini Embedding 2已通過Gemini API和Vertex AI平臺開放預(yù)覽服務(wù)。現(xiàn)有用戶可在保持gemini-embedding-001文本模型使用的同時,體驗新模型的多模態(tài)能力。技術(shù)文檔顯示,該模型特別優(yōu)化了"圖像+文本"混合輸入場景,能夠自動分析不同媒體間的關(guān)聯(lián)性,為智能客服、內(nèi)容推薦等應(yīng)用開辟新可能。

行業(yè)分析師指出,多模態(tài)嵌入技術(shù)的成熟將重塑信息檢索范式。傳統(tǒng)關(guān)鍵詞搜索依賴精確匹配,而向量搜索通過語義理解可返回更符合上下文的結(jié)果。例如,當(dāng)用戶搜索"藍色連衣裙"時,新模型不僅能識別商品圖片,還能理解描述文字中的材質(zhì)、款式等細(xì)節(jié),甚至關(guān)聯(lián)到穿搭建議視頻。這種能力在電商、醫(yī)療、教育等領(lǐng)域具有廣泛應(yīng)用前景。

 
 
更多>同類天脈資訊
全站最新
熱門內(nèi)容
媒體信息
新傳播周刊
新傳播,傳播新經(jīng)濟之聲!
網(wǎng)站首頁  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)隱私  |  RSS訂閱  |  違規(guī)舉報 魯公網(wǎng)安備37010202700497號