在近日舉行的中國北京國際科技產(chǎn)業(yè)博覽會上,一款能夠用藏語進行自然交互的智能大模型成為焦點。這款名為“DeepZang”的藏語大模型,通過藏語語音識別和生成技術(shù),為藏語使用者提供了全新的智能交互體驗。
研發(fā)團隊介紹,傳統(tǒng)通用大模型主要基于漢語、英語等語言訓練,在處理藏語時存在明顯不足。西藏大學博士研究生才讓東知指出,通用模型生成的藏語回答往往缺乏自然語感,帶有明顯的人工翻譯痕跡。而“DeepZang”通過專門使用藏語語料進行訓練,能夠以更地道的藏語思維進行思考和作答。
在展會現(xiàn)場,觀眾可以通過智能鼠標用藏語提出各種問題,模型能夠準確識別并給出流暢的藏語回答。從撰寫牦牛買賣合同到創(chuàng)作贊美父母的詩歌,再到提供營養(yǎng)建議,這款大模型已經(jīng)能夠完成多種日常任務。一位來自西藏山南市的翻譯工作者洛桑頓玉表示,使用這款模型后,原本需要兩三個人合作40分鐘完成的翻譯工作,現(xiàn)在一個人20多分鐘就能完成。
據(jù)產(chǎn)品負責人多吉美久介紹,“DeepZang”的訓練數(shù)據(jù)包括近7000萬條藏漢平行語料和超過30500小時的藏語語音數(shù)據(jù),覆蓋了衛(wèi)藏、康巴、安多三大藏語方言區(qū)。這種全面的方言覆蓋使得模型能夠?qū)崿F(xiàn)跨方言交流,有效解決了不同地區(qū)藏語使用者之間的溝通障礙。國家知識產(chǎn)權(quán)局網(wǎng)站顯示,開發(fā)方西藏覺羅數(shù)字產(chǎn)業(yè)管理有限公司已申請相關(guān)專利,通過聲紋識別與方言分類技術(shù)進一步提升溝通效率。
目前,“DeepZang”已擁有30多萬用戶,其中18至40歲青年占比超過70%,用戶主要分布在西藏、青海、四川和甘肅等藏語使用地區(qū)。隨著西藏電力和網(wǎng)絡(luò)基礎(chǔ)設(shè)施的不斷完善,主電網(wǎng)覆蓋所有縣區(qū)、70%行政村通達5G網(wǎng)絡(luò),為藏語AI的推廣應用提供了有力支撐。
盡管取得了一定進展,但研發(fā)團隊坦言仍面臨諸多挑戰(zhàn)。多吉美久表示,用戶反饋在使用過程中會遇到“token余額不足”的問題,這反映出當前模型在算力成本和商業(yè)運營方面還存在不足。此次參加科博會,正是希望尋求更多合作機會,解決資金壓力和商業(yè)閉環(huán)等問題。公司董事長旦增羅布認為,參與這類科技展會有助于企業(yè)更好地融入全國科技創(chuàng)新生態(tài)。
當被問及藏語大模型的意義時,AI自身給出了這樣的回答:對于藏語使用者,它是新時代的高效工具;對于其他語言使用者,它架起了溝通的橋梁。






















