新加坡國(guó)家人工智能計(jì)劃(AI Singapore,簡(jiǎn)稱(chēng)AISG)近日宣布,其最新版本的“Sea-Lion”大語(yǔ)言模型(LLM)——Qwen-Sea-Lion-v4,將由阿里巴巴集團(tuán)旗下的阿里云提供全面技術(shù)支持。這一合作標(biāo)志著AISG在區(qū)域人工智能領(lǐng)域邁出了重要一步,同時(shí)也反映出國(guó)際科技合作在推動(dòng)本地化創(chuàng)新中的關(guān)鍵作用。
Qwen-Sea-Lion-v4基于阿里云的Qwen3-32B基礎(chǔ)模型構(gòu)建,該模型經(jīng)過(guò)特別優(yōu)化,以適應(yīng)東南亞地區(qū)多樣化的語(yǔ)言需求。阿里云在新聞稿中強(qiáng)調(diào),Qwen3-32B不僅接受了超過(guò)119種語(yǔ)言與方言的預(yù)訓(xùn)練,總數(shù)據(jù)量達(dá)到36萬(wàn)億詞元,還額外使用了超過(guò)1000億個(gè)東南亞語(yǔ)種詞元進(jìn)行強(qiáng)化訓(xùn)練。這一舉措顯著提升了模型對(duì)本地表達(dá)方式、對(duì)話(huà)細(xì)微差別以及區(qū)域性知識(shí)領(lǐng)域的理解能力。
此次合作中,阿里云不僅提供了基礎(chǔ)模型架構(gòu),還深度參與了Qwen-Sea-Lion-v4的高級(jí)后訓(xùn)練階段。通過(guò)這一階段的技術(shù)支撐,模型在處理復(fù)雜語(yǔ)言任務(wù)時(shí)的表現(xiàn)得到了進(jìn)一步提升。與此同時(shí),AI Singapore貢獻(xiàn)了其開(kāi)源的區(qū)域性數(shù)據(jù)集,包括針對(duì)東南亞語(yǔ)言任務(wù)的數(shù)據(jù)整理、優(yōu)化與評(píng)估工作,為模型的本地化適配提供了重要支持。
在性能評(píng)估方面,Qwen-Sea-Lion-v4在參數(shù)規(guī)模低于2000億的開(kāi)源大模型中表現(xiàn)突出,位居“東南亞語(yǔ)言模型綜合評(píng)估排行榜”首位。這一成果不僅驗(yàn)證了模型的技術(shù)實(shí)力,也為其在區(qū)域內(nèi)的廣泛應(yīng)用奠定了基礎(chǔ)。目前,該模型已在AI Singapore官網(wǎng)及Hugging Face平臺(tái)開(kāi)放免費(fèi)下載,供研究人員和開(kāi)發(fā)者使用。
新加坡在人工智能領(lǐng)域的投入持續(xù)加大。2023年12月,該國(guó)啟動(dòng)了一項(xiàng)總額7000萬(wàn)新元(約合3.81億元人民幣)的國(guó)家級(jí)計(jì)劃,旨在全面提升多模態(tài)大語(yǔ)言模型的科研與工程能力。該項(xiàng)目由新加坡國(guó)家研究基金會(huì)(NRF)提供資金支持,并獲得資訊通信媒體發(fā)展局(IMDA)的認(rèn)可,進(jìn)一步凸顯了新加坡在人工智能領(lǐng)域的戰(zhàn)略布局。
此次阿里云與AI Singapore的合作,不僅為東南亞地區(qū)的人工智能發(fā)展提供了新的技術(shù)范式,也為全球科技企業(yè)如何通過(guò)本地化創(chuàng)新滿(mǎn)足區(qū)域需求提供了參考。隨著Qwen-Sea-Lion-v4的推廣應(yīng)用,預(yù)計(jì)將在教育、醫(yī)療、金融等多個(gè)領(lǐng)域產(chǎn)生積極影響。











