华为昇腾发布AI超节点与龙虾方案,驱动国产算力新落地
2026年,AI Agent迎来规模化爆发的关键节点,由AI技术引领的增量时代正式开启。近期,华为昇腾计算业务总裁张迪煊指出,顺应AI演进趋势与客户需求,未来将聚焦三大核心场景:首先是极致算力场景,旨在满足大规模预训练、强化学习后训练及海量推理部署需求。华为凭借持续的技术突破,构建领先的超节点技术体系,支持大规模推理架构,并开放灵衢协议、核心部件及参考设计,赋能合作伙伴打造超节点系统。
AI超节点代表了一种全新的计算范式。传统AI计算依赖大量服务器与计算节点协同,通常通过以太网连接,但在大模型参数交互频繁时,亟需更高性能的互联技术将机器高效整合,从而将整体计算效率提升数十倍。AI超节点正是为应对大模型时代算力瓶颈而诞生的系统性架构创新。
依托自研的“灵衢”(UnifiedBus)互联协议,华为实现了单超节点内高达8192张芯片的互联,对计算、存储及网络硬件进行了重构,达成784GB/s的带宽,较以往提升15倍,同时显著降低时延,并推出了业界首款通用计算超节点Atlas 950 SuperPoD。该设备支持调用远端内存资源,实现数据的统一处理。
华为超节点Atlas 950 SuperPoD采用液冷设计,有效降低大模型训练的能耗,提升了电能的利用与转化效率。在推理方面,从单次推理升级为适配AI Agent的多轮推理,时延控制在15ms以内,居行业首位。此外,凭借EP技术,业务吞吐量提升3至4倍,推理效率同步提高3至4倍。
中软国际教育副总裁、卓越研究院院长王晓华表示,在国家级人工智能学院项目中,深圳河套学院成功部署了全球首个面向教育科研的384超节点,该项目为AI科研提供了强大的“大脑”。双方通过技术互补与生态共赢,依托华为技术团队与专家支持,完成了昇腾超节点从上线到运营保障的全过程。此次合作深刻体现了华为技术能力、伙伴生态及服务能力的融合,标志着超节点已成为教育领域好用、可用的产业基石,为未来教育科研提供了成熟方案。
其次是中等算力场景,覆盖医疗、智慧教学等行业,持续围绕“开箱即用”理念,平衡快速部署与成本可控,开放中心模组与刀片资源。伙伴可结合模型及软件生态,打造自有品牌的大模型一体机。华为昇腾推出Atlas 800I A3超节点服务,整机提供8.96P INT8算力,配备1TB高速片上内存,点对点带宽达784GB/s。单机算力达到业界平均水平的2.3倍,时延低至20ms。
AI一体机涵盖轻量级、中等算力级、旗舰级及最高算力型等多类产品。轻量级主要支持百亿至千亿参数模型运行;中等算力级面向千亿至万亿级模型;旗舰级则专为超万亿参数大模型设计。
除算力芯片外,还需对上层模型进行调优分配,确保其在昇腾芯片上高效运行,同时适配业界通用的训推框架与加速库。结合合作伙伴的Agent能力、集成能力及数据处理能力,共同构成完整的解决方案并集成于设备之中。
华为去年推出DeepSeek一体机算力方案,今年重点推广Claw一体机方案。以软通一体机超炫1700为例,该机型采用单路鲲鹏920 CPU搭配单卡Atlas 300I Duo,采用MATX塔式机箱设计,体积约30L。基于华为昇腾310系列推理芯片,支持280T FP16 AI算力,内存可选24G/48G/96G,可驾驭Qwen3.5或MiniMax2.5等中小规模大模型。软通华方CLAW工作站一体机采用华为昇腾ATLAS 300I A2卡,可同时“饲养”十个龙虾。
昆仑、华鲲振宇、神州鲲泰、长江计算、宝德、软通华方、百信等七家核心伙伴发布了基于昇腾Atlas350的整机产品。作为昇腾950代际首款上市硬件,昇腾Atlas350搭载全新昇腾950PR(Ascend950PR)处理器,在算力、访存及编程模式等微架构层面实现全面升级。
旗舰版方面,华为推出Atlas 800IA3双机配置,支持万亿参数模型(如Kimi-K2.5-1T)。利用灵衢(UnifiedBus)直连技术,适用于自动研报、合同审核等复杂任务,可支持约200个“龙虾”智能体。
第三是小算力场景,通过开放标准模组与板卡,助力伙伴打造多元化边缘计算设备,这是目前规模最大的海量市场。华为昇腾主要提供Ascend 310I Duo推理卡(280TOPS INT8 AI算力,96GB内存)、Ascend 910(Ascend 310I A2推理卡,560T算力,32/64GB高速内存)等主流产品。
在智能边端这一无处不在的海量场景中,产品面临形态与部署环境的挑战。昇腾开放了更高算力档位、更高集成度及更宽温设计的模组板卡,结合更多OS兼容性与SDK场景,并针对模型进行优化,赋能伙伴打造适应多种场景的解决方案。