开源协作|沐曦联合上海AI实验室推进多芯片异构推理，打造国产算力新体系

发布时间：2026-06-07 07:45阅读：25

近日，上海人工智能实验室更新并开放了DeepLink多元算力混合推理技术方案。作为核心芯片合作伙伴，沐曦股份首批部署了公司标准推理镜像，深度参与这一面向国产异构算力的开源协同生态。

多芯联动，推理模式迈入新阶段

大模型推理的技术发展正逐步跨越“单芯片、单架构”的限制。伴随模型规模增长和应用场景多样化，业界对“异构混推”需求日益增强——不同厂商与架构的芯片能否在同一推理链路中协同工作，成为国产算力生态落地的核心问题。

沐曦股份持续投入行业基础设施建设，助力开发者与各类场景更便捷地使用国产算力。此前，公司与上海人工智能实验室合作，其GPU产品已支持DeepLink多元算力混合推理加速方案。近期，沐曦股份还受邀加入由上海人工智能实验室发起的“AI全环节软硬件验证平台工作组”，成为首批共建单位。

此次，上海AI实验室牵头联合主流国产芯片企业共建DeepLink多元算力混合推理技术方案，整合以下三种互补部署方式，全面满足产业落地需求。

异构集群间混合调度：支持多种异构芯片推理集群的统一调度，不同厂商的国产芯片在各集群上运行独立推理服务，通过DLRouter感知硬件配置，在服务网关层实现多集群任务的负载均衡，提升资源利用率；

异构国产芯片混推：支持多款异构国产芯片的PD分离推理，结合各芯片特性，将Prefill阶段与Decode阶段分配至不同集群，突破单卡性能瓶颈，提升整体吞吐能力；

国产+国外芯片混推：支持国内外芯片协同进行PD分离推理，贴合产业实际需求。

此外，作为DeepLink混推方案的关键组件之一，DLRouter此次开源支持KV Cache感知的精细化请求路由，可智能识别推理请求特征并分流至适配硬件集群。该架构兼容多元国产芯片与主流大模型推理框架，适用于高并发AIGC、科学智能、具身仿真等场景，同时为策略调度与资源编排提供标准化能力，便于开发者快速集成部署，构建高效异构推理服务。

沐曦股份首批上线的标准镜像完整支持上述所有推理场景，方便开发者按需选用。这不仅是对公司产品成熟度的验证，也体现了其积极共建开源生态的决心。

开源共进，国产算力迈向协同生态

国产AI算力的竞争，已从单一芯片性能转向生态构建能力的比拼。

沐曦股份长期致力于构建开源驱动的计算生态体系。去年2月，公司开源自研软件栈MXMACA，现已积累近50万注册开发者。目前，MXMACA已兼容支持40多种AI框架、500多个AI模型与4500多个开源项目，并完成对25款主流国产模型的Day0适配。公司目标是围绕MXMACA打造开放、兼容、高效的计算生态，构建人工智能时代的“Android”。

展望未来，沐曦股份将持续深耕开源路线，携手产业伙伴推动国产算力从“可用”走向“好用”，从分散走向协同共赢。

关于沐曦股份

沐曦股份专注于自主研发全栈高性能GPU芯片及计算平台，为智算、通用计算、云渲染等领域提供高能效、高通用性算力支持，赋能数字经济发展。

← 上一篇：AI 与地震仪联手捕捉布氏鲸神秘低鸣下一篇：AI+教育国策启动，中国教育体系迎来智能变革 →