效率跃升 30%!华为发布昇腾亲和大模型,月底全面开源
快科技 6 月 12 日讯,在华为开发者大会(HDC 2026)的主题演讲环节,华为常务董事兼终端 BG 董事长余承东正式揭晓了昇腾亲和大模型,该方案实现了从算法架构至训练推理全链路的覆盖。
作为行业首款采用 DSA+SWA 独立分层混合架构的模型,昇腾亲和大模型专门针对 MoE(混合专家)模型中的专家路由难题实施了深度优化。
基于昇腾原生训练技术,性能实现双重飞跃:训练效率提高 30%,512K 长序列训练吞吐量增长 50%,且训推一致性超过 99%,有力保障了训练结果的高精度复现。
借助 mHC、Muon 及 ModAttn 等前沿技术,昇腾亲和架构确保了高精度表现。特别是在大稀疏比场景下,通过对专家路由的专项改良,实现了更精准的算力分配,完美适配超大规模混合专家模型。
推理侧完成了高吞吐与低时延的双重优化,支持 128K+1K 的超长序列处理。这使得昇腾亲和大模型在长上下文任务中优势显著,能够支撑实时交互类 AI 应用的大规模落地部署。
尤为引人注目的是,昇腾亲和大模型制定了全方位的开源战略,该计划定于 6 月 30 日正式开启。
届时,包括模型结构、权重参数、技术报告、推理代码、预训练代码、后训练代码以及训推算子在内的七大核心组件将分批发布,向全球开发者全面开放所有能力。
责任编辑:红茶
