成人美女黄网站免费|哔哩哔哩免费观看在线视频|freexx老女人|欧美精品三区|近的2019中文字幕在线|97中文字幕一区二区|日本jazz护士

巨人財經(jīng) - 專業(yè)科技行業(yè)財經(jīng)媒體

Allen人工智能研究所推出開源MolmoWeb:小尺寸網(wǎng)絡(luò)智能體展現(xiàn)新可能

   發(fā)布時間:2026-04-03 06:09 作者:馮璃月

Allen人工智能研究所(Ai2)近日宣布推出MolmoWeb,這是一款全新的開源視覺網(wǎng)絡(luò)智能體,隸屬于其Molmo 2模型家族。該模型提供40億和80億參數(shù)兩種版本,設(shè)計上兼顧了性能與輕量化,能夠在本地設(shè)備上運行,為研究人員提供了更靈活的實驗環(huán)境。

在功能實現(xiàn)上,MolmoWeb能夠模擬人類操作瀏覽器的完整流程:通過分析網(wǎng)頁截圖預(yù)測下一步動作,執(zhí)行點擊、輸入文本或滾動等操作,從而完成導(dǎo)航、表單填寫、商品搜索及信息檢索等任務(wù)。這種設(shè)計使其在標準瀏覽器使用基準測試中表現(xiàn)突出,甚至超越了OpenAI早期版本的GPT-4o,同時在開放權(quán)重模型中領(lǐng)先于Fara-7B和GLM-4.1V-9B等競爭對手。

訓(xùn)練數(shù)據(jù)的規(guī)模與多樣性是MolmoWeb的另一大亮點。其公開的數(shù)據(jù)集包含3萬個真實人類任務(wù)軌跡,覆蓋1100多個網(wǎng)站的近60萬個子任務(wù),堪稱同類數(shù)據(jù)集中規(guī)模最大的公開資源。團隊還通過可訪問性樹技術(shù)生成了補充合成數(shù)據(jù),并標注了超過220萬個問答對,用于強化模型對網(wǎng)頁元素的理解能力。這些數(shù)據(jù)現(xiàn)已與模型權(quán)重、代碼及評估工具一同在Hugging Face和GitHub平臺開放下載。

Ai2團隊指出,當前開源社區(qū)在視覺網(wǎng)絡(luò)智能體領(lǐng)域面臨多重挑戰(zhàn):缺乏高質(zhì)量訓(xùn)練數(shù)據(jù)、基礎(chǔ)設(shè)施支持不足以及評估工具缺失,這些問題嚴重制約了研究的可復(fù)現(xiàn)性與進展速度。MolmoWeb的發(fā)布旨在填補這一空白,為研究人員提供從數(shù)據(jù)到工具的完整生態(tài)。正如其研究論文所述:“今天的網(wǎng)絡(luò)智能體需要像早期大語言模型那樣的開放基礎(chǔ),以推動整個領(lǐng)域的創(chuàng)新?!?/p>

盡管專有模型在整體性能上仍占據(jù)優(yōu)勢,但MolmoWeb的輕量化設(shè)計與開源特性使其在特定場景中更具吸引力。例如,研究人員可通過調(diào)整模型規(guī)模或訓(xùn)練數(shù)據(jù),快速驗證新算法在資源受限環(huán)境下的表現(xiàn)。這種靈活性不僅降低了研究門檻,也為未來更復(fù)雜的網(wǎng)絡(luò)交互任務(wù)奠定了基礎(chǔ)。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容
本欄最新