成人美女黄网站免费|哔哩哔哩免费观看在线视频|freexx老女人|欧美精品三区|近的2019中文字幕在线|97中文字幕一区二区|日本jazz护士

巨人財經 - 專業科技行業財經媒體

面壁智能聯合華為昇騰開源BitCPM-CANN,端側AI低比特時代加速到來

   發布時間:2026-05-25 18:06 作者:李娜

面壁智能近日攜手清華大學與OpenBMB開源社區,共同推出國內首款基于國產算力平臺(華為昇騰)實現端到端訓練的三值(1.58-bit)大模型——BitCPM-CANN,并同步開源其全系列模型權重。這一突破標志著我國在極低位寬模型領域邁出關鍵一步,為移動端設備運行高性能大模型提供了可能。

據技術團隊介紹,BitCPM-CANN包含0.5B、1B、3B、8B四個參數規模的版本,在保持與全精度模型相近性能的同時,推理階段顯存占用可降低約6倍。實驗數據顯示,其模型能力保留率穩定在90%至97.2%之間,這意味著未來智能手機等終端設備有望直接運行60B參數量級的大模型,顯著提升設備智能化水平。

該模型的研發背景與全球內存市場波動密切相關。面壁智能AI Infra負責人李宇軒透露,自2026年以來內存價格已上漲近5倍,迫使行業重新審視模型部署的硬件成本。這種壓力直接傳導至模型開發環節,促使技術路線向更節省內存的方向演進。BitCPM-CANN的推出正是對這一市場變化的積極響應,通過量化壓縮技術將模型精度降至1.58-bit,在性能與成本間取得平衡。

在技術實現層面,極低位寬模型面臨精度損失的挑戰。研發團隊采用多重優化策略:通過嚴格的數據清洗過濾噪聲信息,選用高性能量化器減少壓縮損耗,并創新性地提出"量化感知訓練+大模型蒸餾"的組合方案。這種訓練方法既能保證低比特環境下的訓練穩定性,又能最大限度恢復模型原始能力。李宇軒比喻稱:"這就像用真空壓縮袋打包貨物,需要在節省空間和保持物品完好間找到最佳平衡點。"

行業觀察顯示,模型量化技術正呈現加速迭代趨勢。2023年主流方案還是FP8精度,如今FP4已成為標配,而2-bit、1.58-bit等更低精度技術正在快速落地。高通已率先實現2-bit硬件支持,國內DeepSeek、智譜等企業也在推進相關部署。值得關注的是,面壁智能團隊僅用三周時間就完成了BitCPM-CANN在昇騰平臺的適配優化,在8B參數規模以下的訓練任務中,昇騰芯片的利用率和穩定性已達到行業領先水平。

盡管極低位寬模型展現出顯著優勢,但技術團隊也坦言存在局限性。模型參數規模與位寬的降低會導致知識存儲能力斷崖式下降,表現為特定任務上的性能波動。針對這一問題,研發團隊計劃通過構建更精細的課程學習體系,針對性強化模型基礎能力,逐步提升其在復雜場景下的表現。

目前,BitCPM-CANN全系列模型已通過開源方式向社區開放。面壁智能表示,希望此舉能降低國產算力平臺在低比特場景下的應用門檻,為開發者提供真實性能的驗證基準,推動極低位寬模型技術的生態建設。

 
 
更多>同類內容
全站最新
熱門內容
本欄最新