AI算力渴求与能源智能化改造:为何双向驱动仍卡在原地
增速最快的两大产业本应形成正向循环——然而实际进展远低于预期,最终由普通消费者承担后果。
过去一年多,我在两个截然不同的场合反复听到类似的讨论,但双方始终鸡同鸭讲。
场景一:数据中心建设方告知公用事业运营商,AI训练任务具有时段调节空间——部署在500兆瓦规模集群上的高耗能训练作业,完全可以在炎热夏季的午后暂停三小时运行,且不会对用户体验造成任何影响。
“稳定容量”还是“弹性供给”?
运营商礼貌地颔首,随即说明:公用事业的综合资源规划(IRP)——这份被视为标准的30年规划蓝图——明确要求“稳定容量”。换言之,公用事业需要全天候500兆瓦的稳定容量支撑,并配有合同规定的发电资源作为保障,否则不会批准数据中心的并网申请。对话至此陷入僵局。
核心矛盾在于:公用事业的20年电力采购合约,与超大规模云厂商的18个月短期合同存在结构性矛盾。
场景二:一位气候科技创业者向超大规模云厂商采购负责人推介,其地热电站可在2028年提供全天候无碳基载电力。采购负责人礼貌倾听后,询问合同细节。当创业者描述标准的20年购电协议时,采购方的神情明显变化。超大规模云厂商通常只签署六个季度的短期合约,并附带重新议价条款。在他们的商业逻辑中,20年几乎等同于跨越了整个地质纪元。
双方都无可指摘。他们各自受制于数十年行业惯例形成的合理约束。但正是这两个场景之间的断层,让“AI驱动能源变革、能源赋能AI发展”的飞轮效应难以真正启动——如今,齿轮正在空转打滑。
承受损失的并非科技巨头,而是普通居民用户。他们的电费正在上涨,用以支付我所说的“冗余税”——因为无法通过数据互通避免供电中断,只能被迫建设高昂的备用基础设施。
在COP30之前,主流叙事描绘的是“双向转型”:AI需求拉动清洁能源进入电网,同时AI技术反哺电网优化。这是个美好的愿景。但基于2026年的实际情况研判,它仍然停留在理想阶段。
瓶颈在于节奏。为受监管公用事业服务的能源转型企业,被要求以“软件迭代速度”推进;而具备分布式系统基因的AI能源创业公司,则被要求在“快速试错、敏捷调整”会招致监管处罚的环境中开展业务。
飞轮无法转动,根本原因在于双方都需要对方的商业落地策略,但目前谁都无法提供。
先看供给端。2024年微软与Brookfield签订的10.5吉瓦框架协议,被业界正确解读为超大规模云厂商成为能源转型核心买家的标志性事件。谷歌与Fervo Energy的多年合作,部署增强型地热项目,堪称超大规模云厂商作为长期战略伙伴参与首批气候基础设施建设的典范。这些合作确实存在,但属于个别案例。
大多数气候基础设施企业都带有“公用事业基因”:24个月的采购周期,根深蒂固的20年合同思维。这种基因与追求合同弹性、保留退出权利的超大规模云厂商天然不兼容。
我在Hortonworks任职时就曾面临类似困境——说服受监管的金融机构信任一个尚未成熟的开放源码技术栈。技术早已就绪,但买方尚未就绪。真正促成交易的,不是更优的性能基准,而是构建了一套将购买风险降至最低的商业机制:参考架构、标杆客户案例、专业服务保障,以及买方已信任的集成商生态。
互联网行业的“持续迭代”基因,在公用事业控制室里反而成了劣势。
目前Crusoe Energy正在破局。它直接解决“搁浅电力”问题——风电(及光伏/天然气)项目因电网输电瓶颈无法消纳,导致发电设施被迫停机或“弃电”。Crusoe的解决方案是在这些区域部署模块化数据中心,作为“表后”即时消纳方,消化原本被浪费的电力,用于AI运算。这是一种披着硬件外衣的软件速度打法。
现在换个视角。能源AI领域面临相反的困境。这些企业由分布式系统工程师、MLOps资深人士和云基础设施背景的人才组成——他们的本能是周迭代、持续部署,并能容忍偶发的线上故障,因为这是真实世界系统构建的常态。
这些本能,在公用事业控制室里同样成为阻碍。
以Camus Energy为例。创始人Astrid Atkinson在谷歌任职15年,离职前担任高级软件工程总监,负责保障全球搜索引擎稳定运行。她的核心论点是:在谷歌积累的分布式系统经验——在全球范围内实时匹配计算负载与容量——正是电网整合数百万分布式能源资源时所必需的。
Atkinson的观点是正确的。但她也坦承,自己面对的客户群体,其运营文化将“变革”本身视为风险因素。她曾指出:“电网管理的本质是一项专注于维持系统稳定的运营工作。而实现这一目标最简便的方式,就是什么都不改变。”
这不是抱怨,而是对商业落地策略的精准诊断。Camus已做了大量基础工作——从农村电力合作社起步,逐步拓展至投资者所有的公用事业公司,并与普林斯顿ZERO Lab合作完成了一项由谷歌资助的研究,证明了灵活的500兆瓦数据中心比僵化数据中心可提前3-5年实现并网。但他们的推进节奏是公用事业节奏,而非软件节奏。
Emerald AI由前美国国务院气候官员Varun Sivaram创立,18个月内融资6800万美元,近期与Nvidia及五家美国主要电力生产商达成合作。其Emerald Conductor平台在256个GPU集群上实现了三小时内降低25%电力消耗,且不影响工作负载性能——该成果已在Nature Energy发表同行评议论文。Sivaram明确指出了这一鸿沟:计算产业与公用事业产业在服务等级方面存在“根本性分歧”。他认为,弥合分歧需要双方重新构建商业语言体系。
GridCARE是第三种路径。它由斯坦福Doerr学院出身、多次创业的Amit Narayan创立,利用生成式AI挖掘电网中已存在但被忽视的闲置容量——这些容量在传统公用事业规划中“不可见”,因为规划方法论诞生于需求平稳的时代。他们与Portland General Electric的首个标杆部署,释放了80兆瓦容量用于2026年数据中心并网,到2029年还将释放400兆瓦,而PGE无需新建任何设施。“优先利用现有容量,再考虑新建”——这是一个披着能源外衣的虚拟化论断。任何经历过虚拟化早期时代的人,都能一眼看出其本质。
这种错配不仅是行业不便,更是对普通人和企业的累退税——而这些人本不应该为AI巨大的能源需求买单。
美国居民电价去年上涨5%,部分地区涨幅超过20%。停电时长自2013年以来增加了61%。劳伦斯伯克利国家实验室预测,到2028年,数据中心用电将占美国总用电量的6.7%–12%。
因为公用事业“看不见”或“不信任”AI负载的弹性,他们只能按最坏情况规划。他们建设昂贵的燃气发电厂和大规模输电线路,来服务一种可能只在10%时间存在的“可靠”需求,而其余成本由所有人分摊。我称之为冗余税。
GridCARE的测算表明:采用弹性方式并网的1吉瓦数据中心,可为中型公用事业节省足够资金,让所有居民用户电价降低5%。但现实是,我们正在建设“以防万一”的基础设施,并将成本分摊给每个家庭。
客观而言,并非所有人都认同这一观点。州监管机构和消费者权益倡导者的反对声音日益增多,他们认为超大规模云厂商利用“弹性”逃避应承担的电网建设成本。
稳定容量义务的存在有其合理性。即使有精妙的软件编排,允许数据中心选择退出,也可能在其真正需要提供弹性时无法兑现,从而将风险转嫁给普通用户。联邦能源管理委员会(FERC)将在2026年6月就数据中心并网改革做出裁决,结果尚不明朗。
这一批评值得认真对待,但它忽视了数据支撑:适度的弹性若及早应用,反而比僵化合同更能降低用户风险。监管机构固守1950年代的规划模型,是用错误的工具(过度建设)捍卫正确的原则(可靠性)。
如果将Camus、Emerald AI和GridCARE放在一起观察,会发现一个重要信号:三家企业、三种不同起点,却正在汇聚到同一个认知——电网的实际容量比任何人想象的都要充裕,只要负载、资源或规划模型能够具备弹性。这种汇聚本身,就是飞轮开始转动的迹象。它正在比政策调整更快地发生。
要让它大规模转动起来,有两件事必须改变,还要有一个具体行动。
第一,向超大规模云厂商销售的气候基础设施企业,需要聘请真正向hyperscaler采购团队成功销售过的商业负责人——不是公用事业老兵,也不是有能源实践经验的咨询师。商业打法截然不同,无法仅凭阅读学习。
第二,向公用事业销售AI能源的企业,需要聘请经历过受监管采购流程的企业销售老兵——不是硅谷的电销打法,也不是产品驱动增长(PLG)模式。而是缓慢的、基于参考架构、生态伙伴、风险工程化的打法,才能在董事会会议上有州监管机构作为沉默参与者的企业里,拿下七位数大单。
而这里有一个具体行动:首家采用弹性调整后负荷预测开展下一次综合费率案的投资者所有公用事业,将设定决定未来十年竞争格局的监管先例。其他公用事业都在等待先行者。
谁先行动,以GridCARE和Camus等企业的工作为基础,建立一套有说服力的方法论,谁就会促使州委员会裁决一个行业一直回避的问题:公用事业规划应该奖励“稳定容量假设”,还是奖励“弹性调整假设”?
这个答案将重塑数百亿美元的资本配置。这是该领域杠杆效应最高的监管时刻,而它目前尚未出现在任何人的议程上。
这一切都不是飞轮示意图描绘的那样。示意图里画的是齿轮。真正需要的是一次握手——在两个从未以这种速度做过生意的行业之间,在两种完全不同的采购文化之间,由少数愿意构建前所未有商业机制的企业来中介,再由监管机构的裁决来决定:普通居民用户究竟是补贴AI建设,还是从中受益。
事实证明,电力本来大多已经存在。缺失的,是翻译层。这才是双向转型的真正工作,而它才刚刚起步。