标签
清华携手华为昇腾:AI大模型训练内存占用锐减六成

清华携手华为昇腾:AI大模型训练内存占用锐减六成

快科技5月24日报道,当前AI算力的核心痛点已从显卡转移至存储介质,特别是国内在高端HBM内存方面存在短板,因此各类优化方案层出不穷。近期清华大学的一项研究成果显示,其在华为昇腾平台上成功将内存占用压低了六倍。 面壁智能、清华以及 OpenBMB 团队共同推出了 BitCPM-CANN,这标志着首个基于华为昇腾 NPU 打造的端到端 1.58 比特(三元)大模型训练平台问世。 该系统采用了独特的三元量化算法,将模型参数压缩至 -1、0、1 三个数值状态,不仅使显存占用减少了 6 倍,同时也有效降低了能耗。

2026-05-25 15:48:47  |  6 阅读