标签

算力投资版图扩展:GPU 周边产业崛起

发布时间:2026-06-08 10:05来源:微信阅读:2

AI 计算领域的下一份支出清单,已经不再只盯着 GPU 那一项。

过去两年,业内谈 AI 基础设施,大家首先想到的几乎都是 GPU、HBM、先进封装。这些当然关键,也依然是核心焦点。但当 AI 集群规模持续扩大,另一个问题会迅速凸显:芯片计算再快,数据能否及时送达?服务器部署再多,网络能否承受?

本文要剖析的,正是 GPU 周边那张日益膨胀的账单:光互联、以太网交换、SerDes、SiPho、定制计算。它们不如 GPU 抢眼,却越来越像是 AI 数据中心的根基。

先看一组数据。

Marvell 披露的 AI 营收路线图为:FY23 约 2 亿美元,FY24 超过 5.5 亿美元,FY25 超过 15 亿美元,FY26 超过 25 亿美元。真正值得关注的,不只是增速快,更要看增长来源。

在这套 AI 基础设施体系中,资金并非只流向一颗加速芯片,而是流向几类系统能力:定制计算、以太网交换、互联、存储控制器。

换算成产业术语,就是四个支出项:

我更倾向于将这种现象理解为一次"价值溢出"。GPU 仍是主角,但 AI 数据中心已不能只靠单一主角撑场面。

AI 集群的挑战,不仅在于算得够不够快,更在于数据能否准时到达。

通用计算时代,一个任务通常落在一个处理器上。AI 加速计算则不同,一个任务会被分配给多个处理器,训练和推理都依赖大量节点协作。

节点一多,连接就多;连接一多,互联和网络就开始成为瓶颈。

资料中有一个很直观的判断:AI 使互联速度升级周期从大约 4 年翻倍,压缩到约 2 年翻倍。400G、800G、1.6T、3.2T 往上走,节奏明显加快。

更关键的是,互联数量会随着集群规模放大。资料中的示意图显示,从 128 个 XPU、128 条互联,到 100 万个 XPU、1000 万条互联,光互联增长速度快过 XPU。

因此,AI 基础设施不能只问"买多少卡"。卡买回来后,怎么连、怎么交换、怎么跨机房传输,开始变成另一门大生意。

互联市场的数字很醒目:Marvell 相关 interconnect TAM 从 2023 年约 43 亿美元,到 2028 年约 139 亿美元,年复合增速 27%。

这不是单一产品线,而是一组连接能力一起升级:

这里最容易写过头的是 SiPho。

资料中提到 3D SiPho engine,目标是 4 倍带宽、更低每比特成本,并支持从 1.6T 扩展到 6.4T 以及更高。这个叙事很强,但不能简单写成"硅光马上全面替代传统光模块"。

更稳的说法是:硅光正在从可插拔模块往更深的位置走,未来可能延伸到 CPO、光芯粒等形态。它有想象力,也有工程难度。

AI 机房里的连接,不是越快越好,而是谁能在速度、功耗、距离和成本之间算清楚账。

很多人看 AI 网络,第一眼会盯光模块、网卡、线缆。交换芯片的存在感反而没那么强。

但集群一大,交换芯片很难继续低调。

资料中给了一个硬指标:AI 云网络交换芯片从 12.8T 走向 51.2T,使用 5nm 工艺、100G SerDes,晶体管数量超过 600 亿。这个量级,已经不是"端口更多一点"的升级。

交换芯片要同时扛容量、延迟、功耗和软件能力。AI 后端网络里,拥塞管理、负载均衡、流量工程都会影响训练效率。

说得直白一点:GPU 等数据,是钱在空烧;网络堵住,也是钱在空烧。

对应到市场空间,数据中心以太网交换半导体 TAM 从 2023 年约 61 亿美元,到 2028 年约 120 亿美元,年复合增速 15%。这里不能写成"以太网已经赢了",更准确的表达是:AI 云网络给以太网交换芯片打开了新的进入点。

最后一栏,是定制计算。

这部分数字最大:加速定制计算 TAM 从 2023 年约 66 亿美元,到 2028 年约 429 亿美元,年复合增速 45%。

这很容易被包装成一句话:云厂商都要做自己的芯片。但这么写会过头。

云厂商做定制芯片,背后不是单纯为了"自研",而是业务差异越来越大。搜索、电商、IaaS、生成式 AI、内部应用,对功耗、延迟、吞吐、成本的取舍并不一样。标准芯片很强,但不一定能把每一种 workload 的账都算到最细。

问题在于,定制计算不是画一张架构图就能做。

资料中列出的能力很重:先进制程、SerDes、2.5D/3D 封装、D2D 互连、HBM chiplet、先进散热、内部工具链。芯片越大,封装越复杂,功耗预算越紧,能留在牌桌上的玩家就越少。

AI 基础设施最容易被误读成一场单点爆发。

但从这份资料看,它更像一串连锁反应:GPU 把算力密度推上去,算力密度又把互联、交换、光芯片、定制计算一起推到更高规格。

钱不是从 GPU 流走,而是在 GPU 旁边长出更多必须付费的系统能力。

AI 时代,算力越集中,基础设施越值钱。

GPU 仍然是舞台中央,但真正决定一座 AI 数据中心能跑多大、跑多快、跑多久的,已经不止那一颗芯片。