面壁智能近日攜手清華大學、OpenBMB開源社區,共同推出并開源了其在低比特大模型訓練領域的突破性成果——BitCPM-CANN。這一三值(1.58-bit)大模型不僅是中國首個完全基于國產算力平臺華為昇騰實現端到端訓練的模型,更在技術層面實現了重要突破。
在5月23日的華為鯤鵬昇騰開發者大會(KADC 2026)上,BitCPM-CANN首次亮相便引發了廣泛關注。如今,面壁智能決定將這一成果的全系列模型向全社會開放,為端側大模型的發展注入新的活力。與傳統BF16精度相比,BitCPM-CANN在推理階段能夠釋放約6倍的顯存紅利,同時將模型能力保留率維持在90%至97.2%的高水平。這意味著,在相同的設備內存下,可以承載更強大的模型能力;或者,在保持相同模型能力的情況下,所需內存僅為過去的六分之一。
這一技術突破對于端側設備,尤其是手機來說,具有重大意義。以手機為例,未來有望在手機上運行參數規模達到60B的大模型,這將極大提升手機的智能化水平。目前,“2-bit”量化已成為端側芯片行業的研究熱點,也是實現手機上運行更大參數模型的關鍵技術瓶頸之一。通過2-bit量化,模型權重可以被壓縮6至8倍,從而能夠存入手機閃存。例如,4GB內存的手機可以存放16B的模型,若配合MoE與激活范圍約束技術,甚至可以存放32B的模型;若內存擴大至8GB,則模型參數可擴展至60B。
面壁智能表示,BitCPM-CANN的發布標志著其高效大模型“小鋼炮”在端側落地能力上的進一步提升。通過開源這一成果,面壁智能不僅展示了自身在低比特大模型訓練領域的技術實力,更為中國端側大模型賽道的發展貢獻了一份新的力量。這一成果的開放,將有助于推動端側大模型技術的普及和應用,為智能設備的未來發展開辟新的道路。





















