大摩重磅解读:智能体颠覆AI价值链,CPU崛起取代GPU
2026年4月19日,摩根士丹利发布了73页的深度报告《Rise of the AI Agent – Global Implications》。该报告提出了一个惊人的观点:AI基础设施的下一阶段,限制因素不再是GPU,而是CPU、内存、基板和设备。
这听起来有些反直觉。过去两年的市场故事是“英伟达、HBM、台积电”——GPU是绝对的主角。然而,大摩提供了一个不同的视角:当AI从“生成”转向“自主行动”(Agentic AI)时,系统真正的瓶颈正从算力本身转移到“协调算力”上。而“协调”归CPU管理,而不是GPU。
为什么智能体的出现会改变这种状况?大摩将智能体AI分解为三个支柱:大脑(LLM,运行在GPU上)、调度(Orchestration,运行在CPU上)和知识(Memory,运行在内存和存储上)。
在生成式AI时代,工作流很简单:用户提问,GPU吐出一个答案。CPU只是一个“辅助”角色。但智能体AI截然不同——它需要规划任务、调用外部API、检索数据、执行代码、反思结果,并在必要时进行循环迭代。
英伟达CEO黄仁勋在今年3月的GTC 2026上引用了一句精准的话:“CPU不再只是支持模型,它在驱动模型。”
大摩引用了乔治亚理工和英特尔的联合研究:在智能体工作负载中,CPU端处理占端到端延迟的比例高达50%到90%。换句话说,很多时候GPU是在“空等CPU完成工作”。如果这个数字成立,意味着过去几年关于GPU利用率的假设都需要重新计算。
更深层的学术研究也证实了这一观点。2025年11月发表在arXiv上的论文《A CPU-Centric Perspective on Agentic AI》通过全栈分析发现,在五个代表性智能体工作负载中,工具处理延迟占端到端执行时间的84.5%到90.6%,CPU动态功耗占总能耗的44%。通过CGAM和MAWS两项突破性算法,研究团队分别实现了2.1倍和1.41倍的P50延迟加速,首次系统性地证明了Agentic AI中CPU瓶颈的可解决性,标志着AI系统优化正从GPU中心主义向CPU-GPU协同计算转变。
大摩的核心结论是:智能体带来的是更“重”的单次推理,还是更多的步骤、状态和协调,这些工作天然更适合CPU处理。这带来了两个直接后果:首先,集群层面的CPU与GPU配比将系统性上升;其次,DRAM从“容量配置项”升级为“性能与吞吐的核心系统组件”。数据中心的瓶颈将越来越多地出现在内存带宽、数据搬运、互连时延和系统级协调上,而不是单纯的GPU算力。
过去,“1颗CPU服务约12块GPU”是AI服务器的典型架构描述。但报告指出,随着智能体工作流变长、工具调用和上下文管理变得复杂,这一比例正在迅速缩小。
以英伟达路线图为例,更新估算显示:在Rubin平台附近,CPU与GPU配比接近1:2;若向Rubin Ultra等更激进形态发展,甚至可能出现2颗CPU对应1颗GPU的反向配置。即使仅从1:12改善到1:8,对于超大规模部署而言,CPU的绝对需求量也将出现数量级的跃升。
一旦这一方向成立,CPU需求的弹性将从“跟随服务器出货量”转变为“跟随智能体复杂度”,这意味着CPU需求的增长将更具结构性,而不仅仅是传统硬件换代周期的延续。
这种结构性变化已经在供应链中显示出明确信号。由于超大规模云服务商的激进采购,英特尔和AMD的服务器CPU在2026年全年产能已基本售罄。两家公司计划将服务器CPU价格上调10%至15%,其中高端AI型号上涨15%至20%。在英特尔2025年第四季度财报电话会上,CEO陈立武坦言:“我对未能完全满足市场需求感到遗憾。”
摩根士丹利提供了一个新的测算框架,将数据中心CPU分为三类:第一类是头节点CPU(Head Node),即直接连接在GPU机架上的控制层CPU。假设2030年全球部署500万颗AI加速器,每颗配2颗高端CPU,均价5000美元,这部分TAM约为500亿美元。第二类是调度CPU(Orchestration),这是智能体AI的全新需求——规划与调度、工具链、RAG管线、KV cache和向量库等。假设新增1000万至1500万颗CPU,均价3000美元,这部分TAM为300亿至450亿美元。第三类是存储节点和网络节点上的其他CPU,TAM约为25亿至150亿美元。三类相加,2030年数据中心CPU总市场规模将达到825亿至1100亿美元,其中智能体AI直接贡献的增量是325亿至600亿美元。
与此同时,DRAM需求也将爆发。到2030年,智能体工作流将额外创造15至45EB的DRAM需求,规模相当于2027年全行业年供给的26%至77%。SemiAnalysis研究指出,在微软Fairwater数据中心支持OpenAI的配置中,一个48兆瓦的CPU和存储基础设施支撑着295兆瓦的GPU集群,功率比约为1:6,这一数据直观地揭示了CPU在超大规模部署中的基础地位。
如果按英伟达黄仁勋“2030年AI基础设施投资3-5万亿美元”的更激进假设,CPU TAM甚至可能达到2000亿至4500亿美元。
大摩报告的另一核心贡献是将受益分析从单一的GPU算力扩展到全栈系统工程视角。分析师明确指出:AI资本开支的受益者将从少数芯片巨头扩散到整个全球供应链。DRAM、ABF载板、晶圆代工、存储、连接器和被动元件等环节将从“配角”升级为新的瓶颈和利润池。
在ABF载板领域,供需矛盾尤为尖锐。ABF载板是AI服务器中高算力芯片封装的核心基材。当前供需紧张的根源在于上游关键材料——T-Glass的短缺。美系外资预计,ABF载板供给短缺比例在2026年下半年将达到10%,2028年扩大至42%。与此同时,日本味之素凭借ABF在全球AI芯片供应链中占据超过95%的份额,成为隐形的“卡脖子”环节。随着AI芯片封装复杂度激增,ABF用量成倍增加,但扩产受限于工艺和良率,难以匹配算力需求,材料瓶颈正从底层限制芯片供给。
在代工环节,台积电CoWoS先进封装产能和3nm/2nm先进制程已被英伟达、苹果、微软、谷歌等科技巨头提前锁定至2027年甚至2028年。AI基础设施的竞争已进入“物理约束大于算法创新”的新阶段——胜负不再取决于谁的模型架构更好或软件栈更完善,而是谁能提前抢到全球供应链中最稀缺的“资源锁”。
大摩认为,下一轮超额收益可能更多来自那些在智能体工作流中首先成为瓶颈且难以快速扩产的“使能环节”。随着瓶颈在不同环节迁移,AI价值链的权重分布也将随之改变。
资本市场已迅速做出反应。当地时间4月17日,AMD收盘278.39美元/股,股价创历史新高,市值达4538亿美元,连续13个交易日上涨,创下2005年以来最长连涨纪录。英特尔盘中创下70.33美元/股的历史新高,市值达3439亿美元。
大摩在报告中明确列出了核心受益者,覆盖整个AI供应链:计算领域:英伟达、AMD、英特尔、Arm;存储领域:美光、三星、SK海力士;制造瓶颈:台积电、ASML。
SemiAnalysis研究进一步指出,内存预计将占2026年超大规模云厂商资本支出的约30%,远高于2023-2024年的8%。DRAM价格预计在2026年翻倍以上,而AI服务器中使用的高带宽内存(HBM)预计将持续供不应求直至2027年。
更深层次的行业信号是:英伟达的“生态护城河”正面临结构性挑战。过去,英伟达的护城河不仅在于芯片性能,更在于CUDA生态——数百万开发者依赖这套软件栈。但如果智能体时代的瓶颈从“算力”转向“编排”,而编排天然更适合CPU,那么软件生态的竞争重心也将随之迁移。
从这个角度看,英伟达在GTC 2026上发布专为Agentic AI设计的Vera CPU、在Marvell上投资20亿美元的逻辑就变得清晰了——它需要在GPU和ASIC两大生态中都占据节点,以对冲价值链迁移的风险。
国盛证券的分析更具穿透力:Agentic AI对CPU的影响不是线性的,而是乘数级的。在Agentic AI系统中,CPU已成为主要的性能瓶颈。同时,DeepSeek在实验中成功演示了将一个1000亿参数的Embedding表完全存储在CPU DRAM中,而不是昂贵的GPU显存中,通过PCIe通道异步传输,额外推理延迟不到3%。这种跨硬件的存储与计算解耦方案正在打开CPU价值重估的新维度。
摩根士丹利的判断本质上是对“英伟达独享AI增长”叙事的系统性修正。这并非否定GPU的价值,而是承认:AI的增长红利正从“单点”走向“全栈”,从“少数玩家”走向“全球供应链”。
当AI从“聊天”走向“工作”,从“生成”走向“行动”,整个技术栈的瓶颈正在发生根本性迁移。GPU不再是唯一的定价权高地,CPU、内存、基板和设备正从配角走向主角。
大摩的这份报告本质上是为AI基础设施投资绘制了一张全新的“价值地图”——不是否定算力的价值,而是将价值分配从“单点算力竞赛”扩展为“全栈系统工程能力”的系统性重估。
过去两年,AI投资的主线是“算力即权力”;未来五到十年,主线将变为“谁先成为瓶颈,谁就获得溢价”。在这个重新洗牌的过程中,那些在智能体工作流中首先成为瓶颈且难以快速扩产的环节将成为超额收益的最大赢家。
AI投资的下半场已经拉开帷幕。