标签

AI算力“咽喉”之争:Switch芯片版图与国产替代

发布时间:2026-05-06 14:22来源:微信阅读:6

Scale-Up 和 Scale-Out 到底是什么意思?先把概念弄清楚,阅读后文会更顺畅。

Scale-Up:指将单个机柜或服务器内部的 GPU、算力与带宽尽量拉满,依托机内高速互连提升单机能力,重点在低延迟和高吞吐,追求“单点极致”。

Scale-Out:指把大量服务器或机柜通过网络组织成超大规模集群,通过增加节点数量来扩展总体算力,更适合超大模型训练。概括来说,一个偏向把单机做到极强,一个则靠海量服务器/机柜构建庞大算力网络。

芯科技圈从东吴证券《Switch芯片研究框架(一):GPU-GPU互联,从Scale-Up到Scale-Out的格局如何?》中整理出关键干货,和各位老铁一起学习交流,共同提升。

一、全球主流 Switch 芯片厂商格局

1.1 Scale-Up:机柜内 GPU 紧耦合互连核心芯片

NVSwitch:以私有协议主导的 Scale-Up 方向里,NVSwitch 是 NVIDIA 专属的 GPU 直连交换芯片。

从 Pascal→Volta→Ampere→Hopper→Blackwell→Rubin 持续迭代,Blackwell 平台单芯片双向带宽可达 1.8TB/s,属于当前业界带宽水平领先且部署成熟的 Scale-Up 私有方案;同时单机柜最多可支持 72 颗 B200 进行全互联。

博通 SUE:以太网开放 Scale-Up 标准的重要推动者博通凭借约 90% 的市占率掌握数据中心交换市场,推出 SUE 开放规范并免费开放生态,试图让 AI Scale-Up 互连走向标准化,目标对标 NVLink 的封闭体系;其中 Tomahawk Ultra(51.2T)、Tomahawk 6(102.4T)支撑 SUE 架构,单跳可连接 ≥1024 个 XPU,扩展规模相当于 NVLink 方案的 3 倍以上。

Astera Labs(ALAB):采用 PCIe/UALink 双模打造 Scale-Up 的全栈参与者ALAB 是少数将交换芯片、延长线以及软件管理平台做成一体化方案的厂商;其 Scorpio X 系列也已通过 NVIDIA Blackwell 验证。ALAB 主推 UALink 开放标准(由 AMD/AWS/博通/谷歌共同定义),数据速率 200G、时延低于 1μs,功耗可降低 40%,并支持机柜内最多 1024 颗加速器互联,直指 NVLink 垄断带来的替代空间。

1.2 Scale-Out:跨机柜大规模 AI 集群互联芯片

博通:覆盖全场景的交换芯片龙头以 Tomahawk(高端)+Trident(中端)+Jericho(低端)三条产品线构建交换版图。Tomahawk 5(51.2T/5nm)提供 64×800G 端口能力,带宽提升累计超 80 倍、能耗下降达 90%,是 AI 集群 Leaf-Spine 体系中的骨干核心芯片。

Marvell:高端数据中心 AI 交换核心供应商Marvell 通过收购 Innovium 补齐高端产品线。Teralynx 10(51.2T/5nm)可实现 500ns 超低时延,并做到 1W/100G 的低功耗,同时支持 64×800G 端口,对标博通 Tomahawk 系列,以锁定超大规模 AI 集群互联需求。

二、Switch 芯片国产替代路径

2.1 独立芯片厂商:技术突破与规模落地

盛科通信:国产以太网交换芯片的领先力量其产品覆盖 100G~25.6T 的交换容量范围、100M~800G 的端口速率区间;其中 25.6T 高端芯片已实现量产,并进入新华三、锐捷等主流设备商供应链,是数据中心国产替代的关键标的。

数渡科技:PCIe 5.0 交换芯片国产先行者其 PCIe 5.0 交换芯片已进入客户导入与小批量阶段,预计 2025 年底有望实现批量供货,力图突破国产 AI 芯片互联环节的瓶颈。

澜起科技:以 Retimer 为切入口向全互联延伸澜起科技以 Retimer 切入 PCIe/CXL 全互联布局:从 Retimer→MXC→Switch 覆盖全产品线。其 PCIe 6.x/CXL 3.x 相关 Retimer 送样已达到目标要求,并自研 SerDes,持续卡位 AI 底层互联能力。

2.2 大厂自研:生态 + 整机协同突围

海光信息:通过开放 HSL 协议抢占 Scale-Up 生态海光面向全栈开放提供 HSL CPU 互联总线,打通 CPU-GPU-Switch 的全链路,进而构建自主算力互联底座。

华为:51.2T 交换芯片 + 灵衢协议 + 超节点全栈布局围绕自研交换能力推进,采用 51.2T 液冷交换芯片并发布灵衢 2.0 开放互联协议。Atlas 超节点支持万卡级集群,实现算力、带宽与规模上的全面领先。

中兴通讯:AI 超节点交换芯片持续迭代落地中兴自研交换芯片已完成五代迭代,其 AI 交换芯片可支撑 GPU 间带宽从 400GB/s 到 1.6TB/s,并支持千卡级高效互联。

新华三:智擎 NP 芯片补齐网络处理能力新华三的智擎 660 芯片(16nm/1.2Tbps)支持 L2~L7 全层处理,覆盖核心网与数据中心高端场景,用于补强网络处理能力。

//---END---//

免责声明:文中内容基于网络公开报告整理,仅供学习交流参考。文中版权归原机构所有,若涉及侵权请联系删除。