标签

AI 机柜空间告急:电源系统成最大瓶颈

发布时间:2026-06-11 08:00来源:微信阅读:2

随着 AI 算力不断攀升,机柜内最先捉襟见肘的,或许是电力设备的安置空间。

GPU、NVLink、计算单元及冷却装置都在争夺地盘。电源并不会因空间局促而自行隐退:功率需提升,电压须稳定,既要承受 GPU 负载的骤增,又要在电网电压跌落时保持在线。下一代 AI 机柜的角逐,已从芯片与散热,蔓延至电源架、备用电源、峰值削减及 HVDC 架构等领域。

最引人注目的并非效率曲线,而是一张典型 AI 机柜的示意图。

AI 服务器已占据机柜约四分之三的容积。困境也随之显现:再无余地安置更多电源架;无处存放 BBU;亦无空间容纳应对 GPU 动态负载的功率限制架。

AI 机柜的空间账目,已开始难以平衡。

往昔审视服务器电源,人们多关注模块效率、功率及冗余度。置身 AI 机柜,问题更为严峻:服务器本体日益拥挤,电源系统却需肩负更多重任。它不仅要供电,还需备电、削峰、抵御瞬态冲击并适配电网规范。

侧面电源架(Side Power Rack)应运而生。电源、PDU、BBU、CBU 被迁移至机柜旁侧,经由跨接链路连接至 IT 机柜。电源正从“机柜内部组件”演变为“机柜旁的一套独立系统”。

这一变革趋势,数据说明了一切。

这组数据令人瞩目的,不仅是功率的激增。AI 机柜并未为电源系统预留同等比例的空间。功率成倍增长,机柜边界却依旧固定。

效率依然关键。HPRv2 12kW 模块在 277Vac 环境下测得峰值效率 97.52%,满载效率 96.76%;HPRv4 HVDC 设定的目标则是峰值 98.5%、满载 97.5%。

当效率逼近 98% 后,更艰难的课题被推至前台:在高功率工况下,系统能否稳住动态负载。

电源系统的挑战,不仅在于输送多少电能,更在于负载骤然激增时,电压能否保持平稳不波动。

AI 负载的增长绝非温吞缓慢。

电源架的压摆率要求被置于聚光灯下对比:HPRv1 33kW 为 6A/us,HPRv2 72kW 升至 18A/us,HPRv4 100kW 则达 30A/us。负载变化愈快,输出电压越易出现过冲与欠冲。

一个细节至关重要:母排与连接件的总电感,亦会加剧电压尖峰。问题不单源于电源模块本身,还涉及连接器、母排及结构设计等不易察觉的环节。

CBU 被单独强调。它旨在降低 AC PSU 输入端的功率峰值,提升系统可靠性。其面对的并非平均功率,而是 GPU 动态负载引发的短时冲击。

电源系统愈发类似减震器。路面越颠簸,车速越迅疾,减震器的重要性便越不容忽视。

AI 数据中心规模越大,电源设备与电网间的关联就越紧密。

资料提及一种场景:若电压敏感负载,特别是 PSU,在电网电压暂降或浪涌时直接断开,可能触发电网的过频与过压保护。公用事业部门已开始提出异常电压穿越的要求。

几组测试数据值得审视:

这些测试并未宣称问题“已彻底解决”。它揭示的是另一事实:AI 数据中心电源设计,正同时受到电网规则、备电策略及固件控制的多重约束。

AI 机柜规模越大,电源越不像独立模块;它开始伫立于服务器与电网之间,充当缓冲层。

仅关注 PSU,极易低估此次变革的深度。

后半部分列出的原型已指明方向:ORV3 HPR2 72kW 电源架、12kW PSU、CBU Shelf 24kW 脉冲单元,以及 HVDC CBU EDLC 16kW。更进一步,则是 HVDC 侧挂架的调试与启用,将电源系统部署于 IT 机柜旁侧。

AI 服务器持续吞噬空间,电源系统不断叠加任务,二者很难永远挤在同一机柜内。

PSU 负责转换,BBU 担当备电,CBU 致力削峰,HVDC 探索更高层级的配电效率与架构潜能,Side Rack 则解决“安置何处”的难题。

此份材料能支撑的判断是:AI 机柜供电正迈向系统化。它无法支撑的判断是:某条技术路线已成为唯一终极答案。

AI 基础设施建设越深入,越不能只聚焦于 GPU 这一栏。

机柜内是否有空间,电源架能否提升至更高功率,GPU 负载跳变时电压能否稳定,电网电压异常时 PSU 能否扛住,CBU 与 BBU 如何分工,HVDC 是否需外移至 Side Rack——这些问题虽看似幕后,却直接决定整柜系统能否稳定运行。

随着 AI 机柜持续增强,电源不再仅在幕后默默供电,它将成为系统设计的核心组成部分。

下一代 AI 数据中心既比拼算力,也在较量一套更精细、更稳固、更能抵御冲击的电力系统账本。