标签

面壁智能开源首个基于昇腾训练的1.58位端侧大模型

【TechWeb】5月25日,面壁智能联合清华大学、OpenBMB开源社区共同发布了其在低比特大模型训练领域的最新成果——BitCPM-CANN。这是国内首款完全基于华为昇腾算力平台实现的1.53位端侧大模型,该模型在技术上实现了重要突破。在相同设备配置下,该技术展示首次完成,随后已将其完整模型系列向公众开放。据公开信息显示,相比传统BF16精度,该模型在推理过程中节省了约6倍的显存资源,同时模型能力保持在90%至97.2%之间。在相同终端设备上运行时,可承载的模型能力大幅提升,过去需要1/6的内存即可获

2026-05-25 22:29:46  |  10 阅读
清华携手华为昇腾:AI大模型训练内存占用锐减六成

清华携手华为昇腾:AI大模型训练内存占用锐减六成

快科技5月24日报道,当前AI算力的核心痛点已从显卡转移至存储介质,特别是国内在高端HBM内存方面存在短板,因此各类优化方案层出不穷。近期清华大学的一项研究成果显示,其在华为昇腾平台上成功将内存占用压低了六倍。 面壁智能、清华以及 OpenBMB 团队共同推出了 BitCPM-CANN,这标志着首个基于华为昇腾 NPU 打造的端到端 1.58 比特(三元)大模型训练平台问世。 该系统采用了独特的三元量化算法,将模型参数压缩至 -1、0、1 三个数值状态,不仅使显存占用减少了 6 倍,同时也有效降低了能耗。

2026-05-25 15:48:47  |  6 阅读

AI日报014期|5月23日:KARPATHY的CLAUDE.MD四大铁律引爆开发者圈

时间:5月23日 共:10 条 排列:依照影响广度与价值权重的优先级递减选取前10条技术解析Karpathy推出的CLAUDE.md文档凭借其精简高效的AI编程准则在GitHub引发热潮,揽获超22万星标并占据趋势榜首。文件仅65行、4条核心准则,却将AI编程准确率从65%大幅提升至94%。其精髓在于促使开发者"减速",将深度思考、简洁至上、精确修改和目标导向等原则固化为强制性编码准则,旨在克服开发者惯有的"先行后思"倾向。目前众多开发者仍未深入研读这份广受关注的效率指南。

2026-05-23 18:18:28  |  6 阅读

加密市场遭遇血洗!逾11万人惨遭清算 行业巨头亮红灯

风险资产,遭遇全面抛售! 过去24小时内,市场对通胀和油价飙升的忧虑令投资者信心受挫,全球股票等风险资产的抛售浪潮蔓延至加密货币市场。其中,以太坊跌幅一度超过4%,Hyperliquid跌幅超过7%;比特币跌幅一度超过3%,盘中跌破7.9万美元。XRP、Solana、Cardano等主流币种纷纷下挫。 根据CoinGlass数据统计,最近24小时,全球共有11.73万人发生爆仓,爆仓总金额超过3.7亿美元。其中,超过九成为多头仓位爆仓。 值得关注的是,在比特币及全球股市下挫之际,比特币ATM运营商Bitc

2026-05-17 23:00:53  |  9 阅读