AI 集群核心并非 GPU 堆砌,而是带宽互联网络
上一回我们提到,GPU 面临两种结局:一是吃不饱(饿死),二是跑不动(堵车)。
HBM 攻克了第一道难关。而第二种情况——即数万颗 GPU 之间“跑不动”的困境——必须依靠光互联来解决。
但在深入探讨光技术之前,必须先厘清一个关键问题:这些 GPU 究竟是如何相互连接的?
因为大众对于“AI 算力”的认知往往存在偏差。
许多人误以为,AI 数据中心就是“海量 GPU 的简单堆叠”。芯片数量越多,算力便越强。
这种认知,遗漏了最核心的一半真相。
真实的 AI 集群,绝非一堆 GPU 的集合,而是一张网——一张让 GPU 彼此传输数据的“带宽网络”。
打个比方。一个万人规模的工厂,仅招募一万个工人是毫无意义的。若工人间缺乏通道、传送带,无法互相传递物件,那么这一万人并非工厂,只是一万个各自为战的个人。
GPU 亦是如此。将一万颗 GPU 置于机房,若它们间无法传输数据,那它们便不是“一台超级计算机”,而是一万颗互不交流的芯片。
将它们转化为“一台机器”的关键,并非 GPU 本身,而是连接它们的那张网。
那么这张网究竟是何模样?
它实则分为四层,依据“数据传输距离”由内向外扩展。距离越远,带宽越稀缺,成本也越高。
第一层,芯片内部——最短距离,最高带宽。
数据在单颗 GPU 内部流转,从计算单元至其自有内存。这一层的带宽主要依赖 HBM 提供——即前文所述,让 GPU 得以“吃饱”的超宽传送带。这是带宽最充沛的一层,因距离最短。
第二层,芯片之间——GPU 与 GPU 的互联。
在单台服务器内,数颗乃至数十颗 GPU 需互相交换数据。这一层依赖高速互联技术(如英伟达的 NVLink)。一旦距离拉长,带宽便变得珍贵起来。
第三层,机柜之间——一个机柜与另一个机柜的对接。
成百上千颗 GPU 分布在不同机柜中,机柜间需建立连接。至此层级,电信号已无法胜任,必须启用光传输——这正是光模块的主战场。
第四层,数据中心之间——楼宇与楼宇,甚至城市与城市间的连接。
当单个数据中心容量不足,需将多个数据中心互联成更大系统。这是最长距离的传输,依赖长距离光通信技术。
理解这四层架构后,你会洞察一个反直觉的事实:
AI 工厂的本质,并非算力的简单叠加,而是带宽的有机组合。
从芯片内部到数据中心之间,每一层都代表一种带宽形态。距离越向外延伸,带宽越稀缺,价格亦越昂贵。
而“光”这一要素,恰恰从第三层(机柜间)开始介入,且越向外越显关键。这也解释了为何 AI 集群规模越大,光技术越至关重要——因为集群越大,需跨越的距离越远,而远距离带宽唯有光技术方能实现。
因此回归核心观点:AI 集群并非一堆 GPU,而是一张带宽网络。
你购置的 GPU 数量,决定了该集群的“理论算力上限”。然而,GPU 间的带宽是否充足,则决定了这一上限能否真正释放。
往往限制 AI 集群性能的,并非其算力总量,而是其“网络”是否足够宽广。
下一期,我们将深入第三层与第四层之间,探讨一个被多数人忽视却正在发生的关键变革:
为何使用了数十年的铜线突然失效?为何 AI 集群必须将铜替换为光?
这背后,矗立着一堵无法绕开的物理壁垒。
实盘观察,非投资建议。
AI 世界 vs 旧世界·光篇
序 · 若无“光”,再多 GPU 亦成孤岛
① AI 时代,GPU 的两种死法
② AI 集群非 GPU 堆砌,乃带宽网络(本篇)
③ 铜,为何突然失效?(预告)
④ 为何英伟达正将铜换为光?(预告)
⑤ 光模块非终点,资金流向何方?(预告)