在國家超算互聯(lián)網(wǎng)鄭州核心節(jié)點,3套由中科曙光研發(fā)的萬卡超集群系統(tǒng)正式啟動試運行。這一系統(tǒng)以超過3萬張國產(chǎn)加速卡的規(guī)模投入運營,成為國內(nèi)首個實現(xiàn)此量級部署的AI算力平臺,能夠全面支持萬億參數(shù)模型訓練、高通量推理以及AI for Science等復雜計算場景,標志著國產(chǎn)智能算力基礎設施邁入規(guī)模化應用新階段。
從概念驗證到實戰(zhàn)落地,這一突破僅用時不到兩個月。去年12月,曙光scaleX萬卡超集群在HAIC大會首次公開亮相,如今已快速完成技術(shù)轉(zhuǎn)化。系統(tǒng)攻克了高速互聯(lián)網(wǎng)絡、存算傳一體化設計、高密度供電散熱等核心技術(shù)難題,通過統(tǒng)一資源調(diào)度框架實現(xiàn)算力的高效分配,為大規(guī)模AI應用提供了穩(wěn)定可靠的底層支撐。
在生態(tài)兼容性方面,該平臺采用開放架構(gòu)設計,不僅支持CUDA等國際主流軟件生態(tài),還能實現(xiàn)多品牌國產(chǎn)加速卡的混合部署。這種靈活性顯著降低了開發(fā)者的遷移成本,同時具備向十萬卡、百萬卡規(guī)模擴展的能力,為未來算力需求的指數(shù)級增長預留了充足空間。目前,系統(tǒng)已通過國家超算互聯(lián)網(wǎng)實現(xiàn)算力資源的全國一體化調(diào)度,為全球用戶提供普惠型AI計算服務。
作為創(chuàng)新生態(tài)的核心載體,scaleX萬卡超集群已完成400余個主流大模型的適配優(yōu)化,并通過國家超算互聯(lián)網(wǎng)接入上千款應用。在具體場景中,系統(tǒng)展現(xiàn)出強大賦能能力:支持萬億參數(shù)模型的全機訓練與故障自動恢復;為頭部互聯(lián)網(wǎng)企業(yè)核心業(yè)務提供高并發(fā)推理服務;助力國內(nèi)材料研發(fā)模型登頂國際榜單,推動蛋白質(zhì)研究效率提升3至6個數(shù)量級。配套的OneScience開發(fā)平臺進一步降低了多學科交叉研究的門檻,加速科研成果轉(zhuǎn)化。
中科曙光高級副總裁李斌指出,鄭州節(jié)點的上線是技術(shù)突破與產(chǎn)業(yè)需求深度融合的成果。公司將以此為起點,持續(xù)優(yōu)化算力性能與穩(wěn)定性,通過開放合作構(gòu)建覆蓋芯片、算法、應用的完整生態(tài)鏈,讓智能算力像水電一樣便捷可用,為數(shù)字經(jīng)濟高質(zhì)量發(fā)展注入新動能。






















