AI 服务器垂直供电技术深度解析:散热、电容与模组化趋势
AI 服务器 VPD 电源技术专家研讨会议记录
摘要:
此次研讨聚焦于 AI 服务器 VPD(垂直供电)电源技术,深入探讨了散热解决方案、MLCC 电容、硅电容应用、电感模组化发展方向、功率器件市场竞争态势以及当前的行业涨价情况。
核心洞察:液冷散热是 AI 高功耗 GPU 的必由之路;预埋电容技术各厂商差异微小,硅电容则是应对未来超高功率场景的升级关键;电感模组化已成定局,英伟达预计在 3000W 功耗节点切换至模块方案;功率器件市场格局稳固,英飞凌与 MPS 持续领跑;全行业正经历涨价周期。
研讨结论:
一、散热演进:液冷势在必行
鉴于 AI GPU 功耗不断飙升,传统风冷已难以胜任散热任务。液冷技术,特别是冷板式液冷,已成为不可或缺的主流趋势。液冷不仅能高效解决散热难题,还能确保电源芯片运行在最佳效率点,从而避免电力浪费。展望未来,随着 GPU 功耗从 1000W 迈向 3000W 乃至 5000W,液冷方案将更加普及并持续迭代升级。
二、电容技术:MLCC 预埋与硅电容前景
* MLCC 预埋电容:GPU 底部原需部署大量 MLCC 电容,当 VPD 模块占据该区域后,必须在模块内部补充容量以保障电源稳定。模块内可容纳的电容数量受限于尺寸,而电容自身的容值密度也在持续进步(例如从 220uF/1206 封装升级至 470uF/1206 封装)。目前各家模块厂商在预埋电容技术上差距甚微,并非独家垄断,关键在于电容供应商提供的元件性能。三星、村田等顶尖 MLCC 制造商正致力于研发耐高温、高容值产品,以应对未来更高功率与温度的挑战。
* 硅电容:作为面向未来的前沿技术,硅电容利用半导体光刻工艺在硅晶圆上蚀刻而成,拥有体积小、厚度薄、无压电效应(容值不随温度电压衰减)、低寄生阻抗、高可靠性及长寿命等显著优势。现阶段主要配合 IVR(集成电压调节器)技术,适用于 3000W 以上的高端 GPU 方案,预计将在 3-5 年后成为主流。三星电机已斩获为期两年、总值约 10 亿美元的硅电容订单,推测将用于谷歌或 Marvell 的 GPU 项目。目前硅电容市场规模约为 20 亿美元,主要集中于消费电子和汽车领域,数据中心应用尚少。国内企业在硅电容领域相对滞后,宏远等虽有布局但偏向军工,海外则以三星电机、台积电、村田为代表。
* MLCC 用量:单颗几百千瓦级别的 GPU 可能需要数千甚至上万微法的电容,具体用量建议直接咨询电容制造商。
三、电感与模组化发展方向
* 模组化与分立方案对比:英伟达目前在 Blackwell、Rubin 等系列中更倾向于分立方案(电源芯片与电感平铺于大板),因其架构设计能最大化利用板载空间,且分立方案供应链成熟、价格竞争激烈、供货稳定。然而在安培时代的 AE 版本中,英伟达曾尝试外部模块方案,后因成本高昂及单一供应商产能不足而放弃。
* 转向模组化的临界点:当 GPU 功耗攀升至 3000W 及以上时,板面空间将无法支撑分立方案的布局,模组化将成为必然选择。Rubin Ultra 的展板显示电源与电感布局已达极限,预计后续的 Feynman(费曼)代际将正式转向模块方案。从分立过渡到模组,整个供电方案的价值量大致翻倍。例如,当前 500W GPU 使用 24 个模块,售价约 240 美元(含芯片、电感、电容、PCB),而分立方案中的芯片成本可能不足 90 美元。
四、功率器件与竞争格局
* 三次电源 DrMOS 厂商:MPS 在 GPU 市场占有率领先,英飞凌在 x86+GPU 综合市场中份额最高,瑞萨位居第三,紧随其后的是 TI、ADI、安森美等。ADI 近年才开始在 AI 领域发力。整体市场格局稳定,“强者恒强”趋势明显。芯片原厂倾向于沿用上一代供应商,除非出现重大质量事故。不过,在当前产能紧缺的背景下,拥有充足产能的厂商有望获取更多份额。
* 国内 DrMOS 厂商:杰华特(已上市)在国内数据中心领域积淀深厚,已与头部客户建立合作,90A 规格产品较为成熟。非上市公司中,东莞长工威也获得了服务器代工商订单。晶丰明源、新鹏等虽有布局但积累相对较少。总体而言,国内 DrMOS 与国际先进水平仍存在一定差距。
* 台达等客户采用国产 DrMOS 的可能性:对于台达供应给谷歌等客户的高端模块(单价数百美元),为节省几美元成本而替换为国产 DrMOS 的可能性极低,得不偿失。
五、行业涨价现状
目前,DrMOS、电感、电容等模拟芯片均处于涨价周期。主要原因有三:① 原材料(铜、银等金属)价格大幅上涨;② 设备产能紧张,晶圆厂和封测厂优先保障利润更高的逻辑芯片和存储芯片,模拟芯片设备投入不足;③ 下游 AI 需求旺盛。部分公司自去年底以来已累计涨价三次。
六、VPD 市场空间估算
可参考以下逻辑进行测算:一颗 500W GPU 约需 24 个模块,1000W 约需 30 个,1500W 约需 40 个。取平均值 35 个/卡,乘以未来两年的 GPU 出货量(如 2026 年约 1200-1500 万张),再乘以模块单价,即可估算市场空间。模块单价目前在 4 美元以上,且随着芯片数量增加(从 2 颗到 4 颗甚至 8 颗),价值量呈上升趋势。