华为昇腾超节点全线适配DeepSeek V4模型
4月24日,DeepSeek V4-Pro与DeepSeek V4-Flash正式对外发布并开源。华为在其官方社交媒体上表示,昇腾平台始终与DeepSeek系列模型保持同步支持。此次双方通过芯片与模型技术的紧密协作,成功让昇腾超节点全系列产品实现对DeepSeek V4系列模型的全面支持。昇腾950通过融合核心运算与多流并行技术,有效降低了注意力机制的计算与内存访问开销,显著提升了推理性能。结合多种量化算法,实现了高吞吐、低延迟的DeepSeek V4模型推理部署。同时,昇腾A3超节点系列产品也已全面完成适配。为方便用户快速进行模型微调,华为还提供了基于昇腾A3超节点的训练参考实现方案。
华为指出,昇腾950超节点重新定义了长文本推理的性能上限,实现了DeepSeek V4-Pro 20毫秒和DeepSeek V4-Flash 10毫秒的低延迟推理。据DeepSeek方面介绍,目前DeepSeek V4-Pro版本的API访问服务吞吐量仍较为有限。预计在今年下半年昇腾950超节点批量上市后,Pro版本的价格将出现显著下调。