智谱GLM-5.1首发登陆华为云 昇腾平台实现Layer级MOE均衡优化
IT之家 4 月 8 日消息,智谱今日正式推出新一代旗舰大模型 GLM-5.1。华为方面宣布,智谱 GLM-5.1“Day0”已同步上线华为云。
据悉,智谱 GLM-5.1 在昇腾算力平台上完成了 Layer 级 MOE 的绝对均衡。借助框架层面的能力优化,实现专家更加均衡地产出 Token;同时结合昇腾 Attention 算子的特性,通过推理框架与硬件协同的专项优化,进一步增强算力分配均衡与 HBM 访存均衡能力。华为云则依托系统级优化实现推理提速,整体吞吐提高 30%。
目前,华为云 MaaS 模型即服务平台已经面向开发者提供免部署、可一键调用智谱 GLM-5.1 API 的 Tokens 服务,并支持在线体验。企业用户还可以通过华为云魔坊(ModelArts)模型训推平台,一键完成推理服务的部署与上线,支持公共池和专属池两类资源部署方案,以满足独占及非独占算力的不同需求。
据IT之家今天稍早报道,智谱 GLM-5.1 被称为当前全球最强开源模型。官方表示,该模型是唯一能够达到 8 小时级持续运行的开源模型;在最贴近真实软件开发场景的 SWE-bench Pro 基准测试中,GLM-5.1 也实现了国产模型首次超越 Opus 4.6。

