成人美女黄网站免费|哔哩哔哩免费观看在线视频|freexx老女人|欧美精品三区|近的2019中文字幕在线|97中文字幕一区二区|日本jazz护士

巨人財經(jīng) - 專業(yè)科技行業(yè)財經(jīng)媒體

通義實驗室開源MAI-UI模型:可跨應(yīng)用執(zhí)行復(fù)雜任務(wù) 提升交互效率

   發(fā)布時間:2025-12-29 15:01 作者:朱天宇

通義實驗室多模態(tài)交互團隊近日宣布,其研發(fā)的通用GUI智能體基座模型MAI-UI正式開源。這一模型專注于屏幕界面理解與操作執(zhí)行,能夠跨應(yīng)用完成多步驟復(fù)雜任務(wù),例如查詢車票信息、在通訊群組中同步內(nèi)容,或調(diào)整會議安排等日常高頻場景。

據(jù)團隊介紹,MAI-UI的核心優(yōu)勢在于其主動交互能力。當用戶指令模糊時,模型會通過提問澄清需求,避免因理解偏差導(dǎo)致任務(wù)失敗。模型支持調(diào)用結(jié)構(gòu)化工具,例如地圖搜索或路線規(guī)劃API,直接替代繁瑣的界面點擊操作,顯著提升任務(wù)執(zhí)行效率與成功率。目前,該模型已推出2B和8B兩種參數(shù)規(guī)模的版本,其中2B與8B版本均已開源,供開發(fā)者自由使用。

在性能驗證方面,MAI-UI在ScreenSpot-Pro、AndroidWorld等多個GUI理解與任務(wù)執(zhí)行基準測試中表現(xiàn)優(yōu)異,成績位居當前領(lǐng)先水平。其應(yīng)用場景覆蓋手機、電腦等主流操作系統(tǒng),能夠適應(yīng)不同設(shè)備的界面交互需求。這一特性使其在跨平臺任務(wù)自動化領(lǐng)域具有廣泛潛力。

開源后,MAI-UI有望推動智能體技術(shù)在終端設(shè)備上的落地應(yīng)用。開發(fā)者可基于其基座模型,快速構(gòu)建定制化解決方案,例如自動化辦公助手、智能客服系統(tǒng)等。團隊表示,未來將持續(xù)優(yōu)化模型性能,并探索更多場景下的交互可能性。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容
本欄最新