标签

算力新范式:英伟达携手电网打造变电站旁微型集群

发布时间:2026-05-14 15:38来源:微信阅读:7

点击蓝字 关注我们

SUBSCRIBEto US

Stuart Bradford

作者:Emily Waltz, Dina Genkina

随着数据中心能耗激增,人工智能产业被迫在电力获取途径上寻求突破。其中一种创新方案是:在公用变电站邻近区域部署微型数据中心,并实施协同调度,依据电力盈余状况动态迁移计算负载。

这正是英伟达及其合作伙伴计划于年内晚些时候启动试点项目所遵循的理念。他们拟在美国五家公用电力公司的管辖范围内,构建约25座此类小型数据中心,单座规模介于5至20兆瓦之间。一旦某座变电站负荷过载或遭遇停电,计算任务将自动转移至供电充裕的其他站点。

为实现这一集群化布局,英伟达已联合数据中心建设商InfraPartners、房地产服务商Prologis,以及非营利组织电力科学研究院(EPRI)共同推动项目落地。

该项目旨在验证一种全新的数据中心建设与运营范式,提升数据中心的韧性,使其更灵活地适应电网电力波动。同时,这也为开发商开辟了一条快速获取电网电力配额的新通道——在电力资源日益稀缺的当下,即便小规模的供电额度也变得弥足珍贵。

EPRI智能自主AI计划与分布式AI架构负责人Ben Sooter指出:“我们调研了各变电站的闲置电力,发现平均每座站点约有5兆瓦的标称可用余量,最高可达20兆瓦。”

Sooter强调,单座机房的容量对多数大型数据中心运营商而言规模过小、吸引力不足;但若将多座同规模小型数据中心统筹组网,视作一个大型算力池进行协同调度,便极具实用价值。此外,将计算任务从过载站点迁移至供电充裕的站点,可使整体可用供电能力提升一倍。

英伟达能源高级总监Marc Spieler补充道:“美国现有5.5万座变电站,即便每座仅预留5兆瓦、10兆瓦或20兆瓦的富余容量,整体算力规模也将迅速累积放大。”

打造数据中心的能源韧性

随着数据中心建设加速,深度挖掘电网每兆瓦闲置电力的重要性将与日俱增。美国是全球半数新建数据中心的所在地,据EPRI测算,到2030年,美国数据中心用电量或将占全国发电量的9%至17%,是当前水平的两倍以上(https://powering-intelligence.epri.com/)。如今,用于训练AI大模型的算力园区已进入吉瓦级建设规模,其耗电量堪比美国一座中等规模城市。

在电网运营商设法承接此类巨量新增负荷之际,数据中心开发商有时需等待电网接入审批长达十年。迫于现实,开发商在电力布局上开始做出极为大胆的决策,这些举措在两年前甚至无法想象。

不少企业选择自建燃气发电厂;有的主动出资新建输电线路及其他电网配套设施;还有少数企业直接投资核聚变与新一代核裂变反应堆初创公司,寄希望于十年后依靠这类新能源满足用电需求。

事实上,电网中可利用的富余电力远超日常实际用量。杜克大学尼古拉斯能源环境与可持续发展研究所2025年的一份重磅报告显示:美国电网发电装机容量的平均实际利用率仅为53%左右(https://nicholasinstitute.duke.edu/sites/default/files/publications/rethinking-load-growth.pdf)。

这是因为美国电力供给体系本就是为满足用电峰值而建设的——即一年中用电负荷最高的时段,如盛夏酷暑。峰值用电负荷几乎可达气候温和时段的两倍,而全年峰值时长通常不足200小时。其余大部分时间里,大批发电机组处于闲置停运状态。

倘若AI数据中心能在用电高峰期降低负荷或错峰用电,便未必总要采取自建电厂这种极端方式。据尼古拉斯研究所报告测算:只要数据中心这类大型用电负荷在全年仅0.25%的时段里适度限电,美国电网就能额外释放76吉瓦供电余量,约占全美峰值用电需求的10%。

具备能源灵活调度能力,还能让数据中心更快完成电网并网,无需坐等新建发电厂落地投产。

将小型数据中心直接建在变电站旁,还能减少对输电线路、电线杆、扩容变压器、开关设备等新增电网基建的投入。英伟达的Spieler还指出,额外一大优势是:变电站本身已铺设高速光纤通信线路,这类小型数据中心可直接接入现有光纤网络。

推理业务的天然优势

数据中心所能提供的用电弹性,在一定程度上取决于工作负载类型。AI算力负载主要分为两类:模型训练与推理部署。模型训练指大语言模型、图像生成模型的研发搭建过程;推理则是调用已训练好的模型,为用户聊天问答、图片生成请求提供响应服务。

模型训练需要超大型数据中心,搭配高密度互联GPU集群。例如Meta的Llama 3.1 4050亿参数大模型,动用16000块GPU,耗时约两个半月才完成训练(https://huggingface.co/meta-llama/Llama-3.1-405B-Instruct)。训练过程中,每一轮都要同步调整全部模型权重,必须依靠英伟达NVLink、无限带宽(InfiniBand)这类高速互联架构实现GPU组网。因此把AI训练任务拆分分散到众多小型数据中心集群,并不具备可行性。

但有利的一点是:模型训练周期长达数月,可以短时暂停算力,在用电高峰期主动降负荷、缩减耗电。

推理业务无需大量GPU与高端组网。AI推理并不需要海量GPU,也不依赖复杂高端的网络架构。推理无需输入海量数据集,只需将单条用户查询送入模型,即可生成结果输出。整个过程不涉及反向传播,也就不需要各分片输入数据之间进行大规模协同调度。正因如此,推理任务非常适合部署在小型数据中心。但时延时效是关键。当你用AI生图工具,把自己的人像合成到可爱猫咪图片上时,自然希望立刻看到成品。所以推理业务没法像训练任务那样,在用电高峰期短暂暂停算力;它的能源弹性,只能通过智能调度、把负载迁移到其他地区来实现。

模块化数据中心企业Mod42战略与运营高级副总裁Valerie Crafton表示:“推理是为数不多可以动态路由调度的算力负载。这意味着可以把算力任务,实时调配到电力富余充足的任意地点。这也是如今业内大力推动在电力充裕地段布局小型数据中心的核心独特动因。”

英伟达与EPRI近期一直在全力论证各类数据中心弹性调度方案。他们将这套依托变电站布局的策略命名为分布式推理。该项目于今年2月正式公布,计划在2026年底前启动首批小型数据中心试点集群的建设。英伟达和EPRI预估,算力负载仅需在约0.1%的时间里跨变电站迁移调度。

数据中心向微型化发展,已是势头渐盛的趋势。Sooter表示:“当下正处在第一波算力建设浪潮,各家都在兴建5吉瓦级的超大型数据中心,体量十分庞大。”但他认为,第二波算力浪潮即将到来,主力就是承载推理业务的小型数据中心。他还提到,科技企业正大力推动这一趋势,因为业界预判2027年AI推理算力需求将迎来爆发式增长。

微信号|IEEE电气电子工程师学会

新浪微博|IEEE中国

Bilibili | IEEE中国

· IEEE电气电子工程师学会 ·

绿色工作岗位在哪里:电力工程

她的父亲告诉她,教育可以改变人生

聊天机器人需设安全防线 杜绝幻觉与精神诱导风险

人工智能现已可在轨处理地球影像