SerDes:AI互连的核心技术
在AI时代,GPU决定了计算能力的上限,而SerDes则决定了算力是否能够真正实现高效连接。
SerDes(串行器/解串器)。如果将AI数据中心比作一座超级城市,那么GPU是工厂、HBM是仓库、光模块是高速铁路,而SerDes就是整个交通系统的“核心动力”。它决定了数据传输速度、能耗水平、延迟程度、芯片间通信距离以及AI集群的扩展能力。
实际上,在AI算力的发展中,其极限已不再仅由GPU决定,而是由“互连”能力所限定。SerDes正是这个互连体系中最基础的部分。
SerDes的关键功能可以简单理解为:将“并行数据”转化为“高速串行数据”。举例来说:原本需要32根数据线同时传输的数据,SerDes可以将其压缩到1根或几根超高速通道中。这样做的优势包括:
1. 大幅减少引脚数量
高端AI芯片面临的一个主要问题是:
IO引脚资源日益紧张。
SerDes能有效降低引脚复杂度。
AI GPU之间的互连越来越复杂。没有SerDes的话:
传统高速电信号方案会遇到瓶颈。
而采用先进SerDes技术后:
即使在较长距离下也能保持低误码率(BER)。
过去数据中心的主要瓶颈在于算力不足。如今问题转变为GPU数量过多但互连能力跟不上。例如:
已经进入
这时真正的问题是:“如何实现GPU之间的高速通信”,因为AI集群中GPU经常处于等待数据的状态。这正是:
性能瓶颈的根本原因。
行业正在从56G、112G向224G演进,未来甚至可能达到448G。这意味着单通道带宽翻倍,但真正的挑战在于:功耗不会自动下降。224G的难点包括:
因此:能做224G SerDes的公司全球极少。这是一个由工艺、DSP、模拟电路、封装、信号完整性、系统架构等多方面构成的“顶级技术”。
过去市场普遍认为:铜互连即将被淘汰,全部会被光互连替代。
但在AI出现后:业界突然意识到:机架内部,铜仍然最具成本优势。原因很简单:光互连成本过高。特别是:
成本依然非常高。于是产业开始出现:“铜退守机架内”,“光负责跨机架”的新趋势。这也是:
铜互连重新崛起的原因。
而这一切的前提是:具备超强长距离传输能力的SerDes。
很多人误以为:SerDes只是一个IP模块。其实不然。它本质上是:“AI时代高速互连的底层物理学基础”,它将推动整个产业链的升级:
224G → 102.4T → 204.8T。交换芯片带宽翻倍。对SerDes的需求量激增。
在224G条件下:信号损耗急剧上升;材料需要升级。M8、低介电常数、低损耗材料需求激增。
连接器正从“机械件”向“射频器件”转变。
AI时代,DAC、ACC、AEC等短距离铜缆重新兴起。因为短距离铜缆具有更低功耗、更低成本和更低延迟的优势。
5. 测试产业链
224G最大难点之一:测试。因为误码率、信号完整性、抖动、热稳定性等参数极其复杂。未来测试设备、高速示波器、BERT、探针卡的价值量将大幅提升。
#光模块