AI 基础设施新战场:为什么光学技术将超越 GPU 成为焦点?
【系列:AI 军备竞赛 · 第四篇 / 共五篇】 ───────────────────────────────── 一个被忽视的关键问题 你有没有想过,一条微信消息从你手机发出后,是如何送达对方手机的? 在某一段传输路径上,它一定会转化为光信号。 从跨洋海底光缆到城市骨干网络,光纤几乎承担了全球所有的远程通信任务。原因在于:光速更快、信号衰减更低、单比特传输成本更经济。 然而在数据中心内部,各类设备之间的互联,仍主要依赖铜缆。 原因很直接:过去数据量有限,铜缆足以应对,且成本更低。 但现在,AI 颠覆了这一格局。 ───────────────────────────────── 铜缆为何逼近极限 电信号传输是铜缆的工作原理,但存在两个固有缺陷: 一是信号衰减。铜缆长度增加,衰减加剧,需要持续放大补偿,能源消耗巨大。 二是高频串扰。并行排列的多根铜缆,高频信号相互干扰,带宽上限受到制约。 对常规应用而言,这些问题在工程层面尚可处理。但 AI 数据中心的带宽需求,正以每两三年翻数倍的速度膨胀。 2024 年,NVIDIA 最新的 NVLink 互联系统已需每秒传输 1.8 TB 数据——约等于同时传送 450 部 4K 影片。 在这个量级上,铜缆已显疲态。工程师们的优化空间,正逐步逼近物理极限。 💡 打个比方:铜缆犹如一条蜿蜒曲折、日渐拥堵的老城街道。不是无法改善——而是这条道路的先天条件,决定了无论怎样改造,都无法升级为八车道高速公路。 ───────────────────────────────── AI 为何必须迈入"光"时代 光信号传输依赖光子而非电子,光子具备多项天然优势: 速率高。光在光纤中的传播速度接近光速,延迟极低。 衰减低。光信号在光纤中传播,衰减远低于电信号在铜缆中的衰减。 容量大。一根光纤可同时承载数十甚至上百个不同波长的光信号,每个波长都是独立的数据通道——即波分复用技术。 能耗低。相同带宽条件下,光传输的能耗仅为铜缆的一小部分。 这些特性使光成为 AI 数据中心下一代互联的唯一选择。 不是可选项——是唯一选项。 自 2023 年起,微软、谷歌、Meta 等巨头均已在新建数据中心中大幅提升光模块占比。部分超大规模数据中心已开始要求机架内部采用光互联,彻底摒弃铜缆。 ───────────────────────────────── 光模块:看似平淡,却至关重要 何为光模块? 简而言之,它是一个"转换器":将服务器或交换机输出的电信号转换为光信号,经光纤传输;在接收端再将光信号还原为电信号。 你家宽带光猫中,就有一个简化版的光模块。 但 AI 数据中心所需的光模块,完全是另一个量级——传输速率需达 400G、800G,甚至 1.6T 每秒。集成度更高、功耗更低、要求极为严苛。 光模块看似平淡,却是整个 AI 算力基础设施中,除硅芯片外最关键的一环。 全球光模块市场规模,预计将从 2023 年的数十亿美元,在数年内突破数百亿美元。 在这条赛道上,美国的 Coherent、Lumentum,中国的旭创、光迅等企业,都是不可忽视的力量。 ───────────────────────────────── 更前沿的方向:CPO 共封装光学 传统光模块的局限在于:作为独立器件插在交换机接口上,信号在交换机内部仍走铜缆,仅在出交换机后才转为光信号。 AI 的终极追求,是将光学器件直接封装到芯片近旁——消除这段"内部铜缆",使电信号离开芯片即刻转为光信号。 这就是 CPO——共封装光学。 CPO 的优势显而易见:功耗更低、延迟更短、带宽更高。理论上可使数据中心能效提升数倍。 但技术挑战同样巨大——将精密光学器件与高速芯片封装结合,热管理、良品率、可靠性等每一环节都是严峻考验。 目前,英特尔、博通、Marvell 等企业均在 CPO 研发上重金投入。NVIDIA 也在积极探索。 预计 2025 至 2027 年间,CPO 将从实验室走向规模化量产。 💡 学界与业界开始大规模研究光子学,并非赶时髦,而是因为无论 AI 如何演进,"光"都是其必经之路。深入理解光学产业链,是把握未来五年 AI 资本布局的关键。 ───────────────────────────────── 更遥远的未来:光学计算 最后,介绍一个更大胆的可能性。 若不仅用光来传输,而是用光来计算呢? 光学计算的核心逻辑:利用光的干涉、衍射等物理特性执行矩阵乘法——而矩阵乘法正是 AI 训练与推理中最核心的运算。 理论上,光学计算可以接近光速、极低能耗完成传统 GPU 需耗费大量时间与电力才能完成的任务。 这一方向目前仍处于早期阶段,已有数家企业深耕——如 Lightmatter、Luminous Computing 等。距离大规模商业化仍有相当路程。 但若真能实现,那将是比 GPU 时代更重大的变革。 到那时,整个 AI 算力产业链格局将被重塑。 先记住这个方向。后面的故事,仍在书写中。 ───────────────────────────────── 这一切指向何方 从 GPU 到 HBM,从电力到光通信,每一次瓶颈的出现,都是一次资本重新布局的契机。 这就是这个系列传递的核心逻辑:AI 的战场并非固化不变,它会持续向新瓶颈转移。 看透瓶颈所在,就能看清新一波机遇所在。 下一篇,也是本系列终篇,我们来探讨一个更宏大的命题:AI 究竟要将这个世界引向何方?Agent、机器人、经济重构,以及我们每一位普通人,在这场变局中的位置。 ───────────────────────────────── 【AI 军备竞赛系列持续更新,关注不迷路】