开源协作|沐曦联合上海AI实验室推进多芯片异构推理,打造国产算力新体系
近日,上海人工智能实验室更新并开放了DeepLink多元算力混合推理技术方案。作为核心芯片合作伙伴,沐曦股份首批部署了公司标准推理镜像,深度参与这一面向国产异构算力的开源协同生态。
多芯联动,推理模式迈入新阶段
大模型推理的技术发展正逐步跨越“单芯片、单架构”的限制。伴随模型规模增长和应用场景多样化,业界对“异构混推”需求日益增强——不同厂商与架构的芯片能否在同一推理链路中协同工作,成为国产算力生态落地的核心问题。
沐曦股份持续投入行业基础设施建设,助力开发者与各类场景更便捷地使用国产算力。此前,公司与上海人工智能实验室合作,其GPU产品已支持DeepLink多元算力混合推理加速方案。近期,沐曦股份还受邀加入由上海人工智能实验室发起的“AI全环节软硬件验证平台工作组”,成为首批共建单位。
此次,上海AI实验室牵头联合主流国产芯片企业共建DeepLink多元算力混合推理技术方案,整合以下三种互补部署方式,全面满足产业落地需求。
异构集群间混合调度:支持多种异构芯片推理集群的统一调度,不同厂商的国产芯片在各集群上运行独立推理服务,通过DLRouter感知硬件配置,在服务网关层实现多集群任务的负载均衡,提升资源利用率;
异构国产芯片混推:支持多款异构国产芯片的PD分离推理,结合各芯片特性,将Prefill阶段与Decode阶段分配至不同集群,突破单卡性能瓶颈,提升整体吞吐能力;
国产+国外芯片混推:支持国内外芯片协同进行PD分离推理,贴合产业实际需求。
此外,作为DeepLink混推方案的关键组件之一,DLRouter此次开源支持KV Cache感知的精细化请求路由,可智能识别推理请求特征并分流至适配硬件集群。该架构兼容多元国产芯片与主流大模型推理框架,适用于高并发AIGC、科学智能、具身仿真等场景,同时为策略调度与资源编排提供标准化能力,便于开发者快速集成部署,构建高效异构推理服务。
沐曦股份首批上线的标准镜像完整支持上述所有推理场景,方便开发者按需选用。这不仅是对公司产品成熟度的验证,也体现了其积极共建开源生态的决心。
开源共进,国产算力迈向协同生态
国产AI算力的竞争,已从单一芯片性能转向生态构建能力的比拼。
沐曦股份长期致力于构建开源驱动的计算生态体系。去年2月,公司开源自研软件栈MXMACA,现已积累近50万注册开发者。目前,MXMACA已兼容支持40多种AI框架、500多个AI模型与4500多个开源项目,并完成对25款主流国产模型的Day0适配。公司目标是围绕MXMACA打造开放、兼容、高效的计算生态,构建人工智能时代的“Android”。
展望未来,沐曦股份将持续深耕开源路线,携手产业伙伴推动国产算力从“可用”走向“好用”,从分散走向协同共赢。
关于沐曦股份
沐曦股份专注于自主研发全栈高性能GPU芯片及计算平台,为智算、通用计算、云渲染等领域提供高能效、高通用性算力支持,赋能数字经济发展。