标签

华为云推出 Agentic AI 新品:十万卡集群算力突破 200EFLOPS

发布时间:2026-06-06 01:49来源:新浪新闻阅读:2

快科技 6 月 5 日讯,据“华为云”官方公众号披露,在当日召开的华为云 INSPIRE 创想者盛典上,华为云隆重推出了包括 Agentic Infra 通智融合基础设施、全新一代模型训推平台以及企业级智能体平台在内的多款 Agentic AI 创新产品。

此次盛会中,华为云首度确立了 Agentic Infra 新范式,其核心架构涵盖“高效 Token 工厂 + 持续学习 + 通智一体化调度 + 安全自治”,并与此同时揭晓了四大 Agentic Infra 重磅新品:

AICS 灵衢智算集群:依托超大带宽的灵衢网络,支撑起十万卡级别的集群规模,总算力高达 200EFLOPS。Token 生成延迟被压缩至 10 毫秒以下,千卡每秒吞吐量可达 500 万 Tokens,在线服务可用性稳居 99.95%,构建出极致高效的 Token 工厂。

AMS Agentic 记忆存储方案:借助 NPU 直连 CMS(上下文记忆存储)硬件,打造出 PB 级的超大记忆空间。支持 KV Cache 分层池化技术,在削减推理成本的同时赋能天级长程任务,突破 Agent 记忆瓶颈,推动智能体实现持续学习。

CCE VolcanoNext 通智一体化调度引擎:凭借“训推共池 + 碎片整合”策略,实现了通智混合算力负载调度的革新,促使资源利用率提升逾 30%。

AgentSphere:构建安全自治的 Agent 运行环境,具备极速弹性伸缩与意图主动防护功能。依托羽量级沙箱技术,达成 100 毫秒级极速启动及每分钟十万级的批量创建能力,助推智能体安全、高效地规模化上云。

华为云同步发布了新一代 ModelArts Next 模型训推平台,集成了 RL 强化学习服务、机密推理、模型路由及模型矩阵四大核心能力。

其中,MaaS 模型路由支持成本优先、效果优先、均衡模式三种策略,能依据请求特征动态智能优选最佳模型。迄今,该平台已上线 15 余款 SOTA 模型服务,模型调度准确率超 95%,调用成本平均下降 20%。

另外,华为云智果(AgentArts)企业级智能体平台全面贯彻 Harness 工程理念,构建了生产级长程任务、企业级安全防护、行业知识深度及全链路可观测四大关键能力,加速行业智能体的规模化落地应用。

值得注意的是,智果开源版 openJiuwen 也已正式上线,其内核与企业版同源度超 90%。与此同时,华为云推出了全新 Agentic 入口“智果园”,汇聚“全栈 Agentic 云服务 + 丰富智能体 + 百模千态大模型”的一体化能力,并将这些能力全面 Skill 化、CLI 化,实现从意图理解、功能开发、资源发放到应用部署的全流程智能体化,提供按需、高效的 Tokens 服务,为用户带来焕然一新的交互体验。

大会期间还发布了具身智能专区,提供一站式具身智能数据合成、模型开发及仿真验证平台,助力具身智能企业加速场景落地。

同时,华为云推出了全球首个全流程具身智能开发平台 CloudRobo,提供安全可信的 PB 级数据底座及开发管线、业界首个云原生具身模型生产引擎,以及首个全国产 Real-Sim 数据生产及模型评测体系,协助机器人实现小时级上云、模型分钟级部署。该平台定于 6 月 30 日开启公测。

此外,大会还推出了智能制造专区,提供一站式工业智能体创新创业环境,赋能工业智能体创新落地;发布科学计算专区,面向 AI4S 行业客户提供统一丰富的模型与智能体使用体验,助力敏捷科研创新。

责任编辑:鹿角