标签

AI基础设施 | 人工智能:数据中心互联技术路线之争(2/4)

发布时间:2026-05-15 21:53来源:微信阅读:5

近期读到一份颇具价值的投研报告,来自Bernstein的《Artificial Intelligence Inside the War for AI Data Center Connectivity》。

报告篇幅较长(逾3万字),UP主计划分四期为大家进行翻译并梳理核心要点。

本期内容主要聚焦Bernstein关于"光进铜退"与"光铜共存"的技术路线论证。光纤连接与铜缆连接的关键分水岭在2027年,届时各大云服务提供商将对scale-up连接方案的技术路径做出抉择。

从供应链议价能力角度分析,UP主认为2027年CPO方案难以实现真正量产,以避免过度依赖TSMC的封装方案而导致丧失议价权。

相关阅读:

AI PCB——技术与供应链解析(笔记版)

财报电话会议 | Coherent(COHR)FY2026Q3(26.5.6)

财报电话会议 | Lumentum(LITE) FY2026Q3(26.5.5)

PCB、载板产业:缺料加剧,2026重点关注上游、载板(下)

PCB、载板产业:缺料加剧,2026重点关注上游、载板(上)

目录

共封装光学技术:数据中心互联领域的核心竞争焦点(上篇:AI基础设施 | 人工智能:AI数据中心互联之争(1/4))

绘制CPO价值链(本期)

AI PCB入门指南:技术与供应链(待更新)

人工智能PC基础:参与者、定位策略与盈利能力(待更新)

投资展望(待更新)

我们的模型分析表明,CPO解决方案的成本至少比光模块高出10%。通过将光学元件(OE)与可编程单元(XPUs)或交换芯片进行集成封装,CPO在能效、信号完整性和网络可靠性方面均优于可插拔式光模块。据估算,光学元件占CPO物料清单(BOM)的约45%。

虽然CPO OE + ELS的物料成本低于1.6T光模块,但若计入交换芯片供应商(如NVIDIA)所收取的利润空间,客户的总体前期成本至少会高出10%。

我们判断TSMC的Coupe平台将成为主流CPO平台。尽管GlobalFoundries在硅光子学领域布局更早,但博通(Broadcom)和NVIDIA等核心客户正转向TSMC的Coupe方案——该方案利用混合键合技术将电子集成电路与光子集成电路进行整合,并能在芯片表面精确集成微透镜和光纤阵列单元(FAU)。这使得EIC和PIC能够分别选择最优的工艺节点;更为关键的是,采用TSMC技术使客户能够实现更高效的系统级集成。

通过CoWoS技术实现整合,使技术应用可从NPO阶段逐步演进至CPO阶段,这一进程将于2026年开始分阶段推进。我们认为CPO和硅光子学对TSMC的直接收入贡献有限,但它们将强化TSMC在前端晶圆及CoWoS业务领域的竞争力。

CPO的制造与测试工艺极具挑战性,更倾向于选择具备技术领先优势的供应商。NVIDIA的Quantum交换芯片每颗集成18个OE,在Spectrum产品系列中这一数字已增至30多个;每个FAU则配备数十根间距极为紧密的光纤,从而实现低插入损耗和高封装密度。我们预计TFC和Senko将于2026年开始供应FAU产品,而FOCI则有望随着OE从PCB转向基板制造而逐步赶上。

CPO中的CW激光器需输出数百毫瓦的功率并具备卓越的热稳定性,这使得Lumentum在这一领域脱颖而出。

此外,OE与FAU之间的耦合,以及在晶圆、芯片和封装层面的测试环节,为Chroma ATE(Outperform)、All Ring、Teredyne和ficonTEC等设备供应商创造了新的发展机遇。

CPO初创企业在推动生态系统发展方面同样发挥着重要作用,其核心竞争力在于提供规模化解决方案。这些企业致力于开发更具颠覆性的架构,涵盖从封装内光互连技术(例如Ayar Labs(私营企业)、Celestial AI(已被Marvell收购)、Lightmatter(已被Cactus收购)到集成式CPO平台(例如Nubis,被Ciena收购)等多种技术路线。从长远来看,这些技术有望实现更高的带宽密度、更低的延迟以及更紧密的XPU集成,但大多数企业仍处于早期试点阶段,实现规模化生产应用的前景尚不明朗。

那么谷歌的光学电路交换(OCS)方案如何?CPO并非超大规模运营商解决带宽与功耗挑战的唯一途径。自TPU v4版本起,谷歌便采用了OCS技术——该技术利用微机电系统(MEMS)镜面将光信号从输入端导向输出端,从而避免了传统交换机中光信号向电信号的转换过程。尽管越来越多的CSP开始关注Lumentum和Coherent等供应商提供的商用OCS解决方案,但其广泛应用仍面临诸多障碍,包括需要对整个技术栈(软件和工具)进行全面重构,以及生态系统尚不成熟。

在2025年GTC大会上,NVIDIA展示了三款基于CPO架构的交换机,包括Quantum X800-Q3450、Spectrum 6810和Spectrum 6800。Quantum CPO交换机配备4个ASIC芯片,每块ASIC周围分布着18个光元件(每个子组件含三个光元件,共六个子组件)。该交换机由18个外部光源(ELS)供电,每个光源包含八个连续波激光器。

我们估算该CPO交换机的总体成本约为7万美元(不含交换机解决方案的利润)。

与1.6T/s光模块的平均售价相比,CPO交换机中光学元件和激光器的成本至少高出10%。这一差额已包含光模块供应商的毛利率(假设为40%),以及CPO交换机供应商NVIDIA的毛利率(假设为50%或更高)。

即将推出的Spectrum 6810将单端口性能提升至3.2T/s,总带宽与Quantum产品相当;此外还提供性能更强的Spectrum 6800交换机,其搭载4块Spectrum-6 ASIC芯片,总带宽达409.6T/s(详见图表1至图表8)。

TSMC

作为XPU制造领域的领导者,TSMC在与众多客户及合作伙伴携手开发CPO解决方案,并将其与前端晶圆及先进封装服务相集成方面发挥着引领作用。TSMC CPO平台中最引人注目的产品是其"COUPE"方案。(图9)。

尽管TSMC正引领众多企业共同将CPO从概念推向商业化,但我们认为TSMC在短期内从CPO获得的直接收入贡献将有限。然而,CPO很可能成为一项互补技术,有助于巩固TSMC在前端晶圆和先进封装服务领域的地位,我们的TSMC模型(可应要求提供)也体现了这一点。

GlobalFoundries(GFS US)

该公司将其硅光子技术产品命名为"Fotonix"。早在TSMC之前,GlobalFoundries便已开始研发硅光子技术——最初是通过2015年收购IBM微电子公司实现,随后开发出90纳米工艺,并于2021年第四季度推出了45纳米工艺。与TSMC类似,GlobalFoundries同样提供基于300毫米晶圆的前端生产服务,并实现芯片与封装的一体化设计;其独特之处在于能够在一个单片整体芯片上同时制造EIC(扩展集成电路)和PIC(专用集成电路)。

相较于TSMC,更早的布局吸引了众多客户(如Broadcom、Cisco、Marvell、NVIDIA、Ayar Labs、Lightmatter、PhiQuantum、Ranovus和Xanadu)与GlobalFoundries合作;但我们认为,其中许多客户——尤其是NVIDIA、Broadcom和Ayar Labs——已将其最新产品转向TSMC平台。

在生态系统方面,GlobalFoundries的合作伙伴包括:

负责光纤阵列单元(FAU)及光纤业务的Corning和Senko;

负责封装业务(例如为Lightmatter提供服务)的Amkor和ASE;

以及负责电子设计自动化(EDA)业务的Cadence和Synposys。

2025年底,该公司还宣布收购了小型硅光子学晶圆厂Advanced Micron Foundry(AMF)(其在新加坡拥有200毫米制程工厂),以及总部位于开罗的初创企业InfiniLink(专注于硅光子学及光模块的高速设计技术)。值得注意的是,MediaTek已于2025年初对InfiniLink进行了投资。

GlobalFoundries预计通过收购AMF将在2026年实现超过7500万美元的营收。尽管该公司预计其硅光子技术业务到2030年营收将突破10亿美元,但我们注意到:虽然部分旧产品仍会留在GlobalFoundries,但其众多客户正将新产品转向TSMC。我们认为这一转变主要源于从NPO/OBO向CPO的转型,而TSMC在这一领域占据明显领先地位。

此外,NVIDIA选择6纳米制程用于其EIC芯片表明,EIC可能需要采用前沿逻辑节点。TSMC发布的幻灯片(图10)还指出,EIC(基于领先节点)与PIC(基于成熟节点)之间的节点差异,更倾向于采用异构化方案(即分别在各自最优节点上制造芯片后再进行互连),而非GlobalFoundries的单片式方案。基于这些因素,目前其技术制程未低于12纳米可能成为未来发展的劣势——尽管GlobalFoundries仍具备竞争力。

Tower Semiconductor(TSEM US/ TSEM IT)

Tower在硅光子学领域同样起步较早。2024年初,该公司宣称已拥有超过50家活跃的硅光子学客户,其中包括Innolight、Coherent和Marvell。2026年2月,Tower宣布计划与NVIDIA合作,共同开发用于"基于NVIDIA网络协议的1.6T数据中心光模块设计"的光子集成电路(PIC)。此外,Tower还宣布其硅光子学技术已具备商业化应用潜力。

在300毫米晶圆的工艺与晶圆键合技术方面,我们认为Tower公司的核心优势及客户认可度主要体现在200毫米晶圆领域,尤其是其0.18微米制程。由于缺乏与CoWoS技术相当的先进逻辑节点和先进封装技术,Tower公司的市场影响力仍将主要集中在原始设备制造商(OE)市场,特别是在片上芯片(PIC)领域,而在代工厂(CPO)市场则影响有限。

Tower公司2025年硅光子学业务营收达2.28亿美元,较2024年的1.06亿美元增长逾一倍。仅2025年第四季度,该业务营收就达到9500万美元。该公司计划将硅光子学产能较2025年第四季度出货量提升5倍,并表示超过70%的新产能已预订或正在预订中,预计将持续至2028年。

英特尔同样拥有硅光子学和CPO技术,但无论是通过自家产品还是代工厂服务,这些技术在客户中的应用都十分有限。

总体而言,GlobalFoundries和Tower在硅光子学领域具有先发优势,但TSMC在先进逻辑和封装技术方面处于领先地位;与这两家公司的深度整合将使TSMC成为EIC和CPO领域的强劲供应商(见图11)。

TSMC在硅基电子器件制造方面实力雄厚,而光学器件通常采用其他材料制造,例如绝缘体上硅(SOI)和硅锗(SiGe)。GlobalFoundries和Tower在这些材料领域经验更为丰富,其较早进入该领域也使其能够充分利用硅光子学的发展机遇——尤其是通过客户已采用的现有产品。

展望未来,EIC技术将向更精细的制程节点发展,这将有助于TSMC提升其在EIC领域的地位;同时,凭借TSMC在EIC与PIC之间的技术衔接优势,其在PIC领域的地位也可能得到提升。更重要的是,CPO需要采用先进的CoWoS封装技术将XPU/交换芯片与EO器件集成封装。因此,我们预计TSMC将在未来几年成为CPO领域的主要供应商。不过,鉴于TSMC当前的营收规模,这一贡献相对有限,因此我们选择通过优化晶圆制造和先进封装技术的预测来隐式反映这一贡献。

与可插拔式光模块生态系统相比,CPO的高度集成架构将更大比例的价值创造机会转移给了半导体制造商。因此,半导体供应商以及关键光学元件或设备供应商很可能是采用CPO技术的主要受益者。

由于CPO高度依赖半导体制造工艺,其供应链由NVIDIA(表现优异)、Broadcom(表现优异)、TSMC(表现优异)以及外包半导体组装与测试(OSAT)企业主导。随着CPO解决方案的普及,Lumentum、TFC、Senko等元件与光子设备制造商,以及Chroma ATE(表现优异)的需求有望持续增长(见图表12至14)。

对于中际旭创等传统光模块公司而言,在CPO或NPO领域中的角色,其结构地位相较于其在插拔式模块领域的地位可能会有所减弱。它们的NPO产品仍在开发中,且似乎主要面向原始设备制造商(OEs)和ELS封装方案。

图15展示了与CPO相关的主要企业的收入及盈利状况;许多供应链企业的股价均出现大幅上涨,尤其是在2026年初以来(见图16)。

Lumentum(Lite US)

Lumentum是800G和1.6T光模块、EML激光器的关键供应商,同时也是CPO技术CW激光器领域的先驱企业,其产品线与NVIDIA的技术路线图高度契合(例如Spectrum-X)。尽管CPO技术可能会用更少的CW激光器取代EML技术,但管理层认为,cw激光器更高的价值将使每个加速器的总光学组件数量保持相近。

更为重要的是,Lumentum在CPO级CW/ELS领域的市场份额很可能高于EML市场;从独立激光芯片向完整ELS模块的转型,将显著扩大其潜在市场。在2026年2月的财报电话会议上,公司管理层表示已获得数亿美元的CPO激光器订单,出货将于2027年开始,并预计首批大规模CPO"量产"出货将于2027年底完成(见图表17)。

天孚通信(300394)

TFC与NVIDIA保持着长达三年的合作关系,共同开发CPO技术,目前主要参与三大核心业务领域:光引擎制造(OEs)、光纤阵列单元(FAUs)及ELS模块。(1)光引擎OE:TFC长期为NVIDIA提供可插拔式光模块;TFC将芯片引擎交付给Fabrinet(FN US)进行封装,随后将模块供应给NVIDIA子公司Mellanox。我们预计TFC还参与了NVIDIA的CPO/NPO OE的封装业务。(2)光纤阵列单元:TFC很可能为NVIDIA的X800-Q3450 CPO交换机提供FAU。(3)ELS模块:自2025年下半年起,TFC便涉足ELS模块封装业务,这使其能够充分受益于未来CPO领域对ELS模块的需求增长。

Fabrinet(FN US)

Fabrinet是一家领先的原创设计制造商(ODM),专注于提供先进的光学封装技术及高精度光学与电子制造服务。其产品涵盖光学模块、有源光缆和激光器。凭借与NVIDIA长期的合作关系,Fabrinet与富士康共同承担系统级CPO组装与测试工作,并将交换机CPO组件及子组件集成到交换机机箱中。Fabrinet管理层未披露其为CPO业务提供的具体产品或解决方案,我们推测其与TFC天孚通信合作,主要负责围绕ASIC芯片的原始设备制造商(OEs)及子组件的最终组装。该公司已获得少量CPO相关收入,并正与另外两家客户共同开发CPO产品。

Senko(9069JT)

Senko Advanced Components作为光纤自动单元(FAU)和多推入(MPO)连接技术的全球领导者,提供金属PIC连接器(MPC)系列,这是一种适用于CPO和SiPh平台的可拆卸、高密度光纤至PIC接口。MPC集成了冲压金属光学平台、自由曲面微镜阵列和精密对准的光纤阵列,可实现光纤带与PIC波导之间低损耗、可重复的光学耦合。Senko被NVIDIA认证为官方SiPh网络技术合作伙伴,并曾与Marvell合作开发CPO技术。基于该MPC和FAU产品组合,Senko还与GlobalFoundries合作将这一概念扩展至晶圆级可拆卸接口,将GF的刻槽PIC平台与Senko的SEAT(Senko弹性平均技术)及MPC结构相结合,实现了精确且可重复的PIC与光纤对准以及高通量SiPh检测(见图18和图19)。

FOCI(3363 TT)

该公司多年来专注于光纤跳线、光纤耦合器等光学元件的研发,并成功进入TSMC供应链为FAU供货。公司已建成一条年产能1.6千兆LPO的生产线,目前正处于产品认证阶段。FOCI正在建设CPO FAU的大规模生产线,预计将于2026年第三季度完成产品验证。通过与TSMC的合作,我们相信其CPO/NPO FAU产品将于2027年开始发货。

康宁(GLW US)

康宁在CPO技术领域发挥着关键作用——不仅开发了专为CPO定制的特种光纤产品,还提供了确保更高可靠性的配置与部署方案(详见康宁与博通联合发布的CPO白皮书)。2025年5月,该公司宣布将与博通合作,为其Bailly CPO系统提供光学组件。

太辰光(300570)

该公司专注于MPO和混排盒(shuffle box)领域,已开发出专利自动化系统,可实现混排盒内光纤的精准对准,从而为寻求替代方案的竞争对手构成技术壁垒。作为康宁公司的长期合作伙伴,太辰光通过承接康宁的外包生产业务,为全球AIDC供应链作出贡献。

除本节已讨论的公司外,ABF基板制造商(如Unimicron)也将受益于CPO技术——该技术采用先进封装工艺,对基板面积的要求日益提高。Unimicron计划到2028年将基板封装尺寸从目前的90×90毫米扩展至120×120毫米。

具备深厚光学技术实力的企业(包括Himax(HIMX US)和Largan)同样可能通过采用CPO技术获益,具体效果取决于其产品成熟度。Largan确认正在开展专门针对CPO应用的内部光学研发工作,但强调鉴于技术复杂性,大规模量产可行性仍不确定。

对于NVIDIA即将推出的NPO交换机,插座供应商如Lotes(3533 TT)也可能发挥作用:该公司一直在为NVIDIA的计算托盘开发插座,尽管该项目已出现延期;双方的合作很可能会延伸至未来的CPO领域。

Chroma ATE(表现优异)

Chroma ATE不断扩充其CPO相邻光子学测试系统产品线,涵盖PIC晶圆与OE测试仪、激光二极管老化测试仪以及专为SiPh/PIC制造设计的可靠性测试仪。这些系统集自动化、精准温控及多通道光/电测量功能于一体,依托Chroma在激光二极管及有源光学元件测试领域的丰富经验,其性能在CPO量产规模下仍能保持优异表现。我们预计该系列测试仪将于2026年下半年开始出货,并在2027年上半年实现更多营收(见图表20)。

Teredyne(TER US)

Teredyne UltraFLEXplus ATE可实现EIC的高速电输入/输出功能。该公司与ficonTEC合作推出了双面晶圆探针测试单元,该产品将Teredyne的测试平台与编程环境与ficonTEC的光学对准及探针技术相结合(Teredyne宣布推出用于硅光子学双面晶圆探针测试的生产系统)。该解决方案可帮助晶圆厂客户在晶圆切割并封装进CPO器件之前,对"已知良品芯片"(KGD)进行测试。

ficonTEC(罗博科特,300757)

2025年3月,ficonTEC推出了其300毫米双面电光晶圆测试仪,可实现硅光子学的高通量测试。该测试仪在软件和硬件层面均与现有自动化测试设备(ATE)兼容,支持顶部高数据速率测试功能,并具备精密的六轴主动对准探针技术。ficonTEC是一家总部位于德国的设备开发商,于2020年首次被中国投资者集团收购。2025年,Robotechnik以约10亿元人民币收购了该公司多数股权,使整体收购成本达到约12亿元人民币。鉴于ficonTEC账面价值约为2亿元人民币、净利润约4000万元人民币,此次交易产生了约11亿元人民币的商誉价值。

台湾万润科技(6187)

我们认为该公司在过去几年中一直是TSMC CoWoS供应链的主要受益者。该公司已将约25%的员工投入CPO相关项目,其2026年的核心产品将是自动化光纤耦合设备。由于已有多个客户参与合作,All Ring预计其CPO设备收入将于2026年末至2027年开始回升。鉴于每台交换机配备多个光纤阵列单元(FAU),且每小时处理单元数(UPH)较低,All Ring预计在CPO技术开始普及后,该设备将面临强劲需求。

台湾旺硅/MPI(6223)

该公司提供晶圆级机械与光学探针平台,可测量插入损耗、光眼图等参数。其300毫米晶圆探针支持多轴光纤阵列对准及宽温控功能,并能与第三方自动测试设备(ATE)实现集成。

Celestial AI(已被Marvell收购,MRVL US)

该公司开发了一项创新技术——光学多芯片互连桥(OMIB),该技术基于TSMC的CoWoS-L技术,是一种先进的封装内光互连架构。

OMIB将中介层直接置于XPU/ASIC下方(而非传统设计中将光学元件置于板边缘),并将光子学功能直接集成到嵌入式互连桥上。这一设计突破了传统互连方案的物理限制,实现了更快、更高效的数据传输。

Celestial AI采用电吸收调制器(EAM),因其热灵敏度较低且体积紧凑,且在公司架构中紧邻高功率芯片部署。Marvell(MRVL US)于2025年12月宣布收购Celestial AI,交易于2026年2月完成。此次收购主要旨在增强Marvell的规模化互连产品解决方案;Marvell预计Celestial的营收增长率将在2028财年第四季度达到5亿美元,并在2029财年第四季度达到10亿美元(详见图表21至24)。

Nubis(私营企业)

Nubis提供专为直接集成至XPUs和ASICs而设计的OE芯片组。该公司采用MZM调制器,因其具备良好的互操作性、可靠性和成熟度;同时优先采用光栅耦合技术,并已成为该领域的早期创新者。Nubis与Samtec合作,推出了兼容Samtec CPC连接器的光模块。2025年,该公司被Ciena(CIEN US)以2.7亿美元收购。Ciena计划通过整合其高速SerDes技术与Nubis的OE芯片组,为机架内部及机架间提供CPO/NPO解决方案。

Ayar Labs(私营企业)

该公司是一家初创公司,获得了包括多家行业巨头在内的投资支持。该公司旗下拥有NVIDIA、AMD、TSMC、GlobalFoundries和Intel等合作伙伴。此前,该公司曾与GlobalFoundries合作进行芯片制造,但现已转向采用TSMC的Coupé平台,旨在进一步提升产品性能。其核心产品包括"Teraphy"光学芯片组和"SuperNova"激光模块。其关键优势在于:该芯片组在电气层面采用符合标准的UCIe 2.0重定时器架构,可兼容包括GPU、CPU、NPU、交换机及存储设备在内的多种供应商封装方案。这一设计使Ayar Labs坚定地立足于开放生态系统,而非追求专有解决方案。该公司还在2025年Hot Chips大会上通过长期误差测试、裕度测试及热应力测试验证了产品的可靠性(见图25和图26)。

Lightmatter(私营企业)

该公司以其3D光学中介层解决方案"Passage"而闻名。该产品是一种薄硅基板,可在单一封装内集成多个硅芯片(包括波导、调制器、光电二极管和耦合器),封装位置位于XPUs/ASICs下方或邻近。Passage M1000中介层的最大面积可达4000平方毫米。该公司采用配备主动控制回路的MRM调制器,以应对热管理挑战,并支持中介层上的密集波分复用(DWDM)技术(见图27)。

尽管本章重点介绍了驱动数据中心下一代连接技术的CPO(中心化光交换平台),但超大规模数据中心运营商为解决带宽、功耗和拓扑结构等挑战所探索的路径远不止于此。

谷歌采用了不同的解决方案——OCS架构。其Apollo网络用OCS取代了传统的电子主干交换机,该架构无需在光与电子设备之间转换信号,即可将光信号从输入端导向输出端。该方案利用3D-MEMS镜面技术动态"瞄准"光纤间的光束,形成低功耗、高带宽的光传输路径,且可通过软件重新配置以适应不断变化的流量模式及大型人工智能数据中心的需求(参见图28至图30)。

通过取消传统交换机中的光-电-光转换模块,OCS显著降低了功耗和散热需求,并通过消除多个交换机层级减少了长期资本支出;同时,它能够支持多代链路速率(从40G到1.6T)。这是因为传统网络在链路速率变化时需要更换新一代电子交换机,而OCS对比特率或协议均不敏感,只需将光纤A连接到光纤B即可。

除谷歌外,Lumentum公司正在商业化其基于MEMS技术的光通信系统(OCS),例如R300型号(配备300×300端口),目前已获得三家主要超大规模客户的订单backlog,金额超过4亿美元,且OCS收入已开始稳步增长。该产品插入损耗仅为1.5dB,可支持10万个GPU集群(见图31)。

相比之下,Coherent公司则致力于推广基于液晶技术的OCS产品,目前已与超过10家客户建立了合作关系。

OCS技术实现广泛普及面临以下挑战:

(1)需要全面重构系统架构——运营商必须规划并调度电路而非仅发送数据包,因此现有路由软件、工具及技术无法直接迁移。

(2)光学组件与MEMS硬件需实现极高的精度对准和低损耗,这使得高端口数量系统的制造、测试和维护变得复杂。

(3)10-100毫秒的重新配置时间意味着该技术最适合处理长时间、可预测的数据流(如人工智能训练),而不适用于短时流量突发。

(4)目前生态系统尚不成熟,因此谷歌正将这项技术推向开放计算项目(OCP),致力于制定明确的开放软件API、控制栈及最低性能/运营要求,以实现多家厂商OCS设备间的互操作性,并能像标准交换机一样进行管理。