AI数据中心供电革新战
近年来,生成式AI技术迅猛发展,诸如ChatGPT、AI绘图、大型语言模型(LLM)及AI代理等应用,均依赖于GPU提供的强大并行计算能力。随着模型复杂度的提升,AI训练和推理所需的计算密度不断加大,使得AI服务器的能耗显著增长。
以往的传统数据中心多使用48V/54V电源架构,单个机柜的功耗通常在10kW至30kW之间。然而,随着AI时代的到来,高密度GPU机柜的功耗已跃升至120kW、250kW,甚至向1MW以上发展,传统供电与散热系统正面临严峻挑战。
为应对高功率和高密度计算需求,新一代AI数据中心正逐步引入以下关键科技:
高压直流供电(HVDC)
液冷技术
集中式Power Shelf架构
SiC/GaN功率半导体
固态变压器(SST)
垂直供电(Vertical Power)
其主要目标包括:
提高供电效率
减少能量损失
降低热量产生
支持超高密度AI计算架构
构建新一代AI能源基础设施
在新一代AI服务器架构中,Power Shelf已成为机柜级供电系统(Rack-Level Power Architecture)的核心。
Power Shelf可视为AI机柜的“集中式供电与电力管理平台”,主要功能包括:
将外部电力转换为服务器所需电压
统一为GPU、CPU和网络设备供电
提供高效电源转换
稳定高密度GPU负载
降低供电损耗与热量产生
传统的电源供应器(PSU)多采用分散式设计,但随着AI GPU机柜功耗的快速上升,传统PSU架构开始面临以下问题:
空间不足
线材过多
电流过高
散热困难
维护复杂
因此,新一代AI机柜逐渐采用集中式Power Shelf架构,将高功率AC/DC或HVDC转换集中在机柜侧,再统一配送至GPU与CPU模块。
Power Shelf已不再是传统PSU的简单延伸,而是影响AI系统性能、供电稳定性、能源效率与散热设计的关键基础设施。
传统48V/54V电源架构原本适用于一般云服务器,但在高密度AI计算环境中,其局限性逐渐显现。
根据功率公式:P=V⋅I,在功率恒定的情况下,若电压较低,系统需要更高电流来传输相同功率,这会导致:
线材发热增加
铜损(Copper Loss)增加
电源效率下降
散热压力大幅增加
配线体积与重量增加
当单一AI机柜功耗提升至数百kW时,传统48V架构已难以满足高密度GPU计算需求。
目前传统供电架构整体效率多在85%~89%之间,能量损耗与散热成本已成为AI数据中心的重要瓶颈。
为解决高功率AI计算带来的供电问题,数据中心正逐步引入400V~800V的HVDC(高压直流)架构。
其核心理念为:
“提高电压、降低电流”
通过提升供电电压,可有效降低电流与传输损耗,从而改善整体供电效率。
HVDC架构具有以下优势:
降低电力传输损耗
减少热能产生
提升供电效率
降低线材使用量
提升空间利用率
更适合高密度AI机柜
相比传统供电架构,HVDC系统效率可提升至约92%~95%,在大型AI数据中心中具备明显优势。
AI GPU平台功耗正以惊人速度攀升。
以NVIDIA新一代AI平台为例,单一AI机柜功率已从过去的数十kW大幅提升至数百kW。
部分下一代设计甚至已朝向1MW~2MW等级迈进,代表AI数据中心正式进入“超高功率时代”。
这意味着:
未来单一AI机柜的耗电量,可能相当于一整层办公室甚至小型工厂。
供电、散热与能源管理的重要性也因此大幅提升。
从上述趋势可明显看出:
AI机柜功率正快速突破传统数据中心设计极限
液冷技术将逐步取代风冷
高压HVDC与集中式Power Shelf将成为主流
未来可能全面迈向机柜级能源平台设计
1. 过渡型HVDC架构
目前多数AI数据中心采用“过渡型HVDC”方案,其供电流程如下:
市电(AC)
→ UPS
→ 800V DC母线
→ Power Shelf
→ 48V/54V DC
→ DC-DC模块
→ GPU/CPU
架构特点
市电输入
电网提供10kV~33kV高压交流电。
UPS系统
将AC转换为DC,并提供备援电池功能。
HVDC Bus
形成400V~800V的高压直流主干供电系统。
Power Shelf
将800V DC转换为48V/54V DC,并统一供应整个AI机柜。
服务器端DC-DC模块
再进一步转换为GPU/CPU所需低电压。
优点
可沿用既有机房设备
导入速度快
改建成本较低
缺点
电力转换层级较多
能量损耗仍高
系统效率约89%
2. 固态变压器(SST)架构
固态变压器(SST, Solid State Transformer)被视为下一代AI数据中心的重要供电技术。
SST最大特点在于:
可直接将10kV~33kV高压交流电转换为800V DC
相比传统架构,SST可大幅减少电力转换层级,因此具备:
更高供电效率
更低能量损耗
更小设备体积
更佳电力质量
更高整合度
目前SST仍处于验证与试点阶段,但包括:
Hitachi
ABB
Schneider Electric
Ampersand
DG Matrix
等企业皆已开始布局AI数据中心SST技术。
未来大型AI数据中心有望逐步导入SST作为核心供电架构。
固态变压器(SST)是一种利用功率半导体与高频电力电子技术,取代传统铁芯变压器的新型供电系统。
其核心技术主要来自:
SiC(碳化硅)
GaN(氮化镓)
等高效功率元件。
SST可在高频状态下进行AC/DC高效转换。
SST核心特点
高效率转换
效率可达92%~95%,部分设计甚至接近98%。
小型化
高频变压器可大幅缩小体积。
双向AC/DC转换
可支持未来直流数据中心架构。
智慧控制
具备数字控制、远程监控与谐波抑制能力。
模块化设计
可依负载需求弹性扩充与维护。
HVDC优势
架构成熟
成本效益高
可逐步升级既有机房
SST优势
效率更高
系统更小型化
更适合未来超高密度AI机柜
未来AI数据中心将朝向以下方向发展:
1MW机柜时代
高压HVDC、高密度供电与三相电源将成为标准。
SiC/GaN普及
具备高耐压、高效率、低损耗与小型化优势。
液冷全面普及
液冷与两相浸没式散热将逐步取代传统风冷。
垂直供电(Vertical Power)
DC-DC模块直接靠近GPU芯片,以缩短供电路径并降低损耗。
机柜级能源平台
Power Shelf将逐步演变为整合:
电力转换
能源管理
热管理
实时监控
的核心能源平台。
电网压力增加
AI负载变动剧烈,未来数据中心将需要:
大型储能系统
智慧电网
动态能源管理
以维持电力稳定。
机柜空间不足
GPU、交换器与液冷设备大量占用空间,Power Shelf的整合难度也持续提高。
能源消耗快速攀升
预估至2030年,全球数据中心耗电量可能达:
700TWh~1000TWh
因此可再生能源、节能技术与高效率供电架构将成为必要配套。
AI服务器与数据中心的发展方向已十分明确:
更高电压、更大功率、更高效率,以及更强散热能力。
未来关键技术将包括:
800V HVDC
1MW高密度机柜
SiC/GaN功率元件
液冷散热技术
固态变压器(SST)
集中式Power Shelf架构
其中,Power Shelf也将从传统电源模块,逐步演变为AI基础设施中的核心能源平台,成为影响AI运算效能、供电稳定性与能源效率的关键技术之一。