标签

AI 算力基石:谁掌控了核心引擎?

发布时间:2026-06-14 19:53阅读:1

潇博有芯事 原创出品

若将 AI 基础设施视作一座急速扩张的巨型工厂,首要问题便是:动力核心掌握在谁手中?无论是模型训练还是推理应用,所有智能的最终落脚点皆是算力。而算力的接入点,正是权力版图上争夺最激烈、筹码最重的一环。

这一层级仅存在三种角色:一家近乎垄断的霸主,一位不可或缺的竞争者,以及一群不愿只做买家的行业巨头。

先谈霸主。NVIDIA 真正售卖的,从来不单是 GPU。GPU 承担计算任务,CUDA 构建开发生态,NVLink 与交换网络将成千上万颗芯片互联成单一系统,DGX 整机与机柜则负责整体交付。它提供的是一整套“即开即用的 AI 工厂”。

这才是其真正的护城河。竞争对手或许能造出不逊色的芯片,却难以复刻这套运行十余年、被全球开发者熟练掌握的 CUDA 软件栈。硬件可被替代,但习惯难以改变。这正是 NVIDIA 对手不断追赶算力,却始终无法绕过其生态壁垒的原因。

且其步伐仍在加速。当前旗舰已是 Blackwell 世代——包括 B300 以及将整柜算力封装的 GB300 NVL72;下一代 Rubin 平台今年正进入量产爬坡期,主要云厂商的部署已排至下半年。黄仁勋将节奏定为“一年一代”,迫使所有人跟随其时钟竞跑。

代价是惊人的需求。据多方估算,微软、谷歌、Meta、亚马逊四家 2026 年的 AI 基建总支出将突破六千亿美元,而 NVIDIA 数据中心业务年营收已近两千亿美元,旗舰芯片订单一度排期至一年后。

它把持的,是整个云端 AI 的算力入口,以及入口背后那套无人能离开的开发习惯。

然而,单一入口的世界充满风险。价格、产能、议价权全数掌握在一家手中。这是任何大客户都不愿接受的局面。因此,AMD 的价值,恰恰不在于“能否击败 NVIDIA”。

其真正意义在于存在本身。只要市场上存在第二套可用方案,云厂商与模型公司便拥有了谈判筹码、分散风险的退路及压低成本的契机。即便 AMD 仅占据一两成份额,其对整体市场价格曲线的牵制作用也是实实在在的。

它绝非摆设。在产的 MI355 已正面对标 NVIDIA 主力产品,今年推出的 MI400 系列直指 Rubin,搭载更大容量新一代 HBM。更具标志性的是,OpenAI 等顶级买家已与 AMD 签署规模达“吉瓦”级的大单——这等于公开宣告:第二供应商不仅是备胎,更是被重点押注的力量。

AMD 捍卫的,是这个市场“绝不能只有一个入口”的底线。

更深层次的反抗,源自买家自身。谷歌、亚马逊、微软、Meta 这些每年斥资数百亿美元采购芯片的云巨头,正做着同一件事:自研。

谷歌的 TPU 已迭代多代,是此领域最成熟的玩家,连部分顶级模型公司也开始大规模采用其算力;亚马逊的 Trainium 已演进至第三代,正为前沿实验室提供训练支持;微软的 Maia 专注推理,依托自家云端海量服务;Meta 的 MTIA 也在持续迭代推进。

逻辑十分清晰。训练是一次性的高峰投入,推理却是每日烧钱的长期业务。当 AI 服务运转起来,推理成本将成为利润表中最敏感的变量。谁能将这块算力掌握在自己手中,谁就更有可能掌控 AI 服务的成本曲线,而非将利润源源不断地输送给芯片供应商。

因此,这群买家的算盘是:训练这类最难、最依赖尖端性能的环节,继续采购 NVIDIA 产品;推理这类量大且可定制的环节,逐步替换为自研芯片。至于如何制造芯片、背后关键技术由谁提供——那是下一层级的故事。

我们在综述中曾设立一把标尺,以此衡量这一层级:

谁不可替代?短期看是 NVIDIA,但不可替代的并非其芯片,而是 CUDA 所构建的生态惯性。绕过硬件易,绕过习惯难。

增长源自何处?正从“训练”向“推理”转移。训练决定谁能登上牌桌,推理决定谁能持续盈利,而推理正是自研芯片最先切入的领域。

若 AI 资本开支放缓,谁受损最重?正是这一层级。它离资金最近,也最顺周期。一旦云厂商收紧基建预算,最昂贵的算力采购将首当其冲,霸主与竞争者皆难幸免。

若云厂商日益增加自研芯片,格局将如何演变?NVIDIA 在推理市场的份额大概率会被逐步侵蚀——有分析认为未来几年其推理占比将显著下滑——但在最顶尖的训练战场,凭借性能与生态优势,短期内仍难被撼动。

不过,无论是 NVIDIA 的 GPU、AMD 的加速卡,还是云厂商自研的 ASIC,它们都有一个共同前提:必须能够互联。单颗芯片再快,也快不过集群。

真正让成千上万颗芯片像一台机器般协同工作的,是另一层更隐蔽却同样致命的权力——数据搬运。那将是下一篇的主角。

— END —

潇博分析原创出品|techinsight

以北大博士与芯片工程师视角,助您读懂芯片、产业与 AI 的结构性逻辑。

推荐阅读

一颗芯片的一生,究竟经历了什么?

简单看懂 AI 硬件的底层逻辑:算、存、连、热、电

人类首次,开始规模化生产智能:AI 产业链的底层逻辑

芯片工程师的“失重感”:明明每天都在解决难题,为何仍不踏实?

读懂 AI 算力瓶颈:一颗 GPU 需闯过多少关,方能成为真正的 AI 算力?

看懂 GTC 2026:英伟达想卖的,已非芯片,而是整个 AI 基础设施

AI 时代下,芯片工程师的系统思维,究竟是何种思维?

ISSCC 2026 深度解读:AI 芯片「单打独斗」的时代,真的结束了?

ISSCC 2026 深度解读:下一代芯片工程师,才是芯片行业的真正瓶颈