标签

AI背后的能源挑战

发布时间:2026-05-20 15:42来源:微信阅读:12

你是否思考过:与AI对话一次,究竟会消耗多少电力?

让我来为你计算一下。当你使用GPT-5.5向AI提出一个较复杂的问题,让它生成一份分析报告时,大约需要消耗3000到5000个Token。这背后,数据中心的服务器需运行GPU进行推理和散热,耗电量约为0.01度电。

虽然听起来不多,但考虑到全球每天有数百亿次的AI请求,这个数字就变得非常惊人了。

2026年5月,AI领域发生了两件大事,让我意识到AI的“电力成本”问题已不容忽视。

第一件事:谷歌母公司Alphabet与黑石集团联合成立了一家新的AI云计算公司。

这家公司的核心卖点是:使用谷歌自研的TPU芯片,打造专为AI推理和训练设计的云平台,目标是在2027年实现500兆瓦的算力规模。

500兆瓦意味着什么?相当于一座中型燃煤电厂的发电量(约300至600兆瓦)。也就是说,这家公司所需的电力,几乎等于一座发电厂的输出。

而且这并非普通数据中心。传统数据中心的服务器承担多种任务,如运行网站、存储数据库或视频转码等。而这家新公司只专注于一件事:为AI提供电力支持。

你可能会问:为什么Google不自己做,而要与黑石合作?

答案很简单:成本太高。

建设一个500兆瓦的AI数据中心,仅基础设施投入就需上百亿美元。尽管Google财力雄厚,但也不愿将全部资产押注于AI基础设施。与黑石合作,实际上是将AI算力视为一种“基础设施资产”,由投资人出资建设,企业按需租用。

这说明了一个事实:AI的底层逻辑正从“软件业务”转变为“重资产游戏”。

第二件事:2026年5月19日,英伟达正式向OpenAI、Anthropic等四大AI实验室交付了Vera CPU。

Vera是什么?你可能知道英伟达的GPU——A100、H100、B200,它们是训练AI的“显卡”。但Vera是CPU,即中央处理器,是电脑的“大脑”。

简单解释:过去训练AI的流程是,CPU负责准备数据和调度任务,GPU负责大量并行计算。CPU是管家,GPU是苦力。英伟达虽是GPU之王,但在数据中心中,CPU一直是英特尔的领域。

现在情况不同了。Vera是英伟达专为AI场景设计的CPU,与自家GPU深度耦合,能大幅减少数据在CPU和GPU之间传输的时间。正如英伟达CEO黄仁勋所说:“这不是一颗CPU,而是一个计算新时代的开始。”

说实话,这话有些营销成分。但从战略上看,英伟达这一步棋走得非常正确。

它不再只是“卖铲子的”——挖金矿的人需要铲子来找它。它想成为“卖整个矿山的”——从芯片到网络到软件栈,全包了。

首批拿到Vera的是谁?OpenAI、Anthropic、Google DeepMind、微软。全是美国公司。

这里有一个微妙的信号。

你可能还记得,2022到2025年间,美国对中国的AI芯片出口管制逐步收紧。先是A100被禁售,后来H100也不行了,连降级版H800也被限制。

现在最新的Vera CPU,首批交付名单中没有中国公司。这不一定是禁令直接导致的,因为Vera是英伟达与几家顶级AI实验室深度合作开发的产物,中国公司未参与也属正常。但它反映了一个现实:在AI算力最前沿,中国企业在物理上被隔离了。

这不是禁售某款产品的问题,而是一个“生态系统”级别的隔离。

英伟达的CUDA软件生态、自研的NVLink互联技术、CPU-GPU协同设计——这些共同构成了一套完整的AI计算体系。即使你拿到了芯片,没有配套的软件和互联技术,性能也会大打折扣。

更值得关注的是,Google和黑石合作的500兆瓦AI云,使用的是谷歌TPU自研芯片。这也是一种“生态闭环”。

说白了,全球AI基础设施正在形成两套体系:一套是美国的,从芯片到云到模型,垂直整合;另一套是中国的,在限制条件下自建替代方案。

那中国这边在做什么?

当然不会坐以待毙。

华为的昇腾系列芯片一直在迭代,百度有自己的昆仑芯,寒武纪、壁仞科技等国产AI芯片公司也在努力追赶。虽然单卡性能与英伟达最新产品相比还有差距,但大规模集群部署能力在快速提升。

更重要的是,中国在“用效率换算力”这件事上走得很前面。

前面提到,百度文心大模型5.1的预训练成本只有业界同规模的6%。这不是靠偷工减料,而是通过“多维弹性预训练”技术,用更聪明的算法降低了对原始算力的需求。

打个比方:别人练肌肉要去高端健身房买顶级器械,你研究出了一套自重训练方法,用公园的单杠也能练出差不多的效果。虽然顶级器械还是好,但你没有它也能行。

这种“效率优先”的思路,正在成为中国AI的一个差异化优势。因为芯片受限是客观现实,那就只能在算法和工程上死磕。结果反而逼出了一些真功夫。

回到电力这个话题。

全球AI数据中心的用电量正在以每年40%以上的速度增长。有研究机构预测,到2030年,AI数据中心的用电量可能占到全球总发电量的5%到10%。

这是什么概念?如果把所有AI数据中心的用电量加在一起,可能超过整个日本的用电量。

而且电力只是问题的一半。冷却呢?一个大型数据中心每天用来散热的水,够一个小城市的居民用一天。

所以你看,Google和黑石搞500兆瓦AI云,不只是商业上的合纵连横,背后还有一个更根本的焦虑:再不建专门的AI基础设施,现有的电网和供水系统根本扛不住。

这也是为什么最近AI圈开始流行一个词:“可持续算力”。

不是“能不能买到更多GPU”,而是“你建的数据中心,有没有足够的电和冷却能力来跑这些GPU”。

2026年5月的这两件事——Vera交付、500兆瓦AI云——表面上是两个商业新闻,但加在一起看,指向的是同一个趋势:

AI正在从一个“软件故事”变成一个“能源故事”。

过去十年,我们聊AI的时候聊的是算法、数据、模型结构。未来十年,我们聊AI会更多地聊电力、芯片制程、冷却效率、数据中心选址。

这件事其实挺讽刺的。AI被寄予厚望要解决人类的能源问题、气候问题,但它自己先成了一个巨大的能源消耗者。

不过我不觉得这是坏事。

每一次技术革命都伴随着巨大的资源消耗,然后技术本身又会反哺资源效率的提升。当年蒸汽机也烧煤烧得很凶,但它最终让整个工业体系的效率提升了百倍。

AI也一样。它现在吃掉的电,未来可能通过优化电网调度、提高工业能效、加速新材料研发,十倍百倍地“还”回来。

但前提是,在“还回来”之前,我们先得保证电网撑得住,芯片跟得上。

这不是一道技术题,这是一道应用题。考的不仅是算法有多聪明,更是基础设施有多扎实。

而这方面,中国有自己的路要走,也有自己的仗要打。