藏語大模型北京科博會首秀：以科技之力跨越語言壁壘助力藏語傳承發(fā)展

發(fā)布時間：2026-05-11 09:09 來源：快訊作者：顧雨柔

在近日舉行的中國北京國際科技產(chǎn)業(yè)博覽會上，一款能夠用藏語進行自然交互的智能大模型成為焦點。這款名為“DeepZang”的藏語大模型，通過藏語語音識別和生成技術(shù)，為藏語使用者提供了全新的智能交互體驗。

研發(fā)團隊介紹，傳統(tǒng)通用大模型主要基于漢語、英語等語言訓練，在處理藏語時存在明顯不足。西藏大學博士研究生才讓東知指出，通用模型生成的藏語回答往往缺乏自然語感，帶有明顯的人工翻譯痕跡。而“DeepZang”通過專門使用藏語語料進行訓練，能夠以更地道的藏語思維進行思考和作答。

在展會現(xiàn)場，觀眾可以通過智能鼠標用藏語提出各種問題，模型能夠準確識別并給出流暢的藏語回答。從撰寫牦牛買賣合同到創(chuàng)作贊美父母的詩歌，再到提供營養(yǎng)建議，這款大模型已經(jīng)能夠完成多種日常任務。一位來自西藏山南市的翻譯工作者洛桑頓玉表示，使用這款模型后，原本需要兩三個人合作40分鐘完成的翻譯工作，現(xiàn)在一個人20多分鐘就能完成。

據(jù)產(chǎn)品負責人多吉美久介紹，“DeepZang”的訓練數(shù)據(jù)包括近7000萬條藏漢平行語料和超過30500小時的藏語語音數(shù)據(jù)，覆蓋了衛(wèi)藏、康巴、安多三大藏語方言區(qū)。這種全面的方言覆蓋使得模型能夠?qū)崿F(xiàn)跨方言交流，有效解決了不同地區(qū)藏語使用者之間的溝通障礙。國家知識產(chǎn)權(quán)局網(wǎng)站顯示，開發(fā)方西藏覺羅數(shù)字產(chǎn)業(yè)管理有限公司已申請相關(guān)專利，通過聲紋識別與方言分類技術(shù)進一步提升溝通效率。

目前，“DeepZang”已擁有30多萬用戶，其中18至40歲青年占比超過70%，用戶主要分布在西藏、青海、四川和甘肅等藏語使用地區(qū)。隨著西藏電力和網(wǎng)絡(luò)基礎(chǔ)設(shè)施的不斷完善，主電網(wǎng)覆蓋所有縣區(qū)、70%行政村通達5G網(wǎng)絡(luò)，為藏語AI的推廣應用提供了有力支撐。

盡管取得了一定進展，但研發(fā)團隊坦言仍面臨諸多挑戰(zhàn)。多吉美久表示，用戶反饋在使用過程中會遇到“token余額不足”的問題，這反映出當前模型在算力成本和商業(yè)運營方面還存在不足。此次參加科博會，正是希望尋求更多合作機會，解決資金壓力和商業(yè)閉環(huán)等問題。公司董事長旦增羅布認為，參與這類科技展會有助于企業(yè)更好地融入全國科技創(chuàng)新生態(tài)。

當被問及藏語大模型的意義時，AI自身給出了這樣的回答：對于藏語使用者，它是新時代的高效工具；對于其他語言使用者，它架起了溝通的橋梁。

更多>同類內(nèi)容