真实夫妻露脸自拍视频在线播放-亚洲精品乱码久久久久久蜜月-免费动漫成人av在线观看-中文字幕av三区三级爽-日韩熟女人妻一区二区-亚洲欧美乱日韩乱国产-一二三四区中文字幕在线-国产美女香蕉久久精品-久久视频在线播放视频

Allen人工智能研究所推出MolmoWeb:開源視覺網(wǎng)絡(luò)智能體新選擇

   時(shí)間:2026-04-03 06:46 來源:快訊作者:至頂AI實(shí)驗(yàn)室

人工智能領(lǐng)域迎來重要進(jìn)展——Allen人工智能研究所(Ai2)正式推出開源視覺網(wǎng)絡(luò)智能體MolmoWeb。作為Molmo 2模型家族的新成員,該系統(tǒng)以獨(dú)特的技術(shù)路徑和開源特性引發(fā)關(guān)注,其40億參數(shù)與80億參數(shù)兩個(gè)版本均支持本地部署,為研究人員提供了輕量化的研究工具。

與傳統(tǒng)依賴專有模型蒸餾訓(xùn)練的網(wǎng)絡(luò)智能體不同,MolmoWeb采用創(chuàng)新的數(shù)據(jù)構(gòu)建方式。研發(fā)團(tuán)隊(duì)通過可訪問性樹技術(shù)生成合成軌跡數(shù)據(jù),結(jié)合3萬個(gè)人類任務(wù)軌跡組成的訓(xùn)練集,其中包含1100多個(gè)網(wǎng)站的近60萬個(gè)子任務(wù)。這種混合訓(xùn)練策略使模型既能理解網(wǎng)頁(yè)結(jié)構(gòu),又能模擬人類操作邏輯。訓(xùn)練數(shù)據(jù)還包含220萬組問答對(duì),通過讓模型回答關(guān)于400個(gè)網(wǎng)站截圖的問題,強(qiáng)化其信息檢索能力。

在功能實(shí)現(xiàn)層面,該系統(tǒng)具備完整的瀏覽器操作能力。通過分析網(wǎng)頁(yè)截圖預(yù)測(cè)行動(dòng)步驟,可完成導(dǎo)航跳轉(zhuǎn)、表單填寫、商品搜索等復(fù)雜任務(wù)。其操作方式與人類用戶高度相似,通過模擬點(diǎn)擊、文本輸入和頁(yè)面滾動(dòng)等交互行為推進(jìn)任務(wù)流程。這種設(shè)計(jì)使其能夠適應(yīng)不同網(wǎng)站的結(jié)構(gòu)變化,無需針對(duì)特定平臺(tái)進(jìn)行定制開發(fā)。

基準(zhǔn)測(cè)試數(shù)據(jù)顯示,MolmoWeb在瀏覽器操作任務(wù)中表現(xiàn)優(yōu)異。其性能超越OpenAI舊版GPT-4o模型,在開放權(quán)重模型領(lǐng)域更是一騎絕塵,40億與80億參數(shù)版本均領(lǐng)先于Fara-7B和GLM-4.1V-9B等同類產(chǎn)品。不過研究人員坦言,當(dāng)前專有模型在綜合性能上仍保持優(yōu)勢(shì),但MolmoWeb的開源特性為學(xué)術(shù)界提供了重要的研究基線。

該項(xiàng)目團(tuán)隊(duì)強(qiáng)調(diào),開源生態(tài)的完整性比單一模型性能更重要。此次發(fā)布不僅包含模型權(quán)重和訓(xùn)練代碼(即將上線),還同步開放了評(píng)估工具和人類演示數(shù)據(jù)集。其中人類任務(wù)軌跡數(shù)據(jù)集的規(guī)模創(chuàng)下公開數(shù)據(jù)集新紀(jì)錄,為后續(xù)研究提供了豐富的訓(xùn)練素材。這種全鏈條開源策略旨在破解當(dāng)前網(wǎng)絡(luò)智能體研究中的可復(fù)現(xiàn)性難題,推動(dòng)技術(shù)透明化發(fā)展。

目前,MolmoWeb已通過Hugging Face和GitHub平臺(tái)向全球研究者開放下載。其輕量化設(shè)計(jì)使個(gè)人開發(fā)者也能在消費(fèi)級(jí)硬件上運(yùn)行模型,這為中小研究團(tuán)隊(duì)參與網(wǎng)絡(luò)智能體開發(fā)提供了可能。隨著訓(xùn)練數(shù)據(jù)的持續(xù)擴(kuò)充和社區(qū)貢獻(xiàn)的加入,這個(gè)開源系統(tǒng)有望催生更多創(chuàng)新應(yīng)用。

 
 
更多>同類天脈資訊
全站最新
熱門內(nèi)容
媒體信息
新傳播周刊
新傳播,傳播新經(jīng)濟(jì)之聲!