标签

AI 耗电惊人,破局之道何在?

发布时间:2026-06-07 02:38来源:微信阅读:2

给孩子的 AI 常识

上期我们算过一笔账:2024 年全球数据中心耗电量达 415 太瓦时,等同英国全年用电;预计 2030 年将翻倍至 945 太瓦时,堪比日本全年总量。ChatGPT 单次回答的能耗竟是 Google 搜索的十倍。

AI 是“电老虎”,这点已成共识。

但关键问题尚待解答:如此高昂的电费,能否降下来?

答案是:各界正在探索,且部分方案已初见成效。

路线一

最直观的思路——并非增加发电,而是让 AI 更省电。

还记得“什么是大模型”文中提到的 DeepSeek 吗?其核心创新在于“混合专家模型”——总参数量超 6000 亿,但每次运算仅激活 300 多亿,其余处于“休眠”状态。这就好比千人工厂,每条产线只需 50 人上岗,其他人轮休。

这不仅是“聪明”,更是直接的节能。激活参数减少,GPU 运算量随之降低,耗电自然下降。

类似思路广泛应用。模型量化——将参数精度从高清降至标清,大幅削减运算量且效果微损。模型蒸馏——用大模型“教导”小模型,使其掌握大模型八成本领,却仅需一成算力。

本质如一:并非所有问题都需满载算力。以恰好足够的资源完成任务,即是最佳节能。

路线二

每代新芯片,单位算力的功耗均在下降。

Nvidia 的 H100 相较前代 A100,在 AI 推理任务上性能提升约三倍,功耗增幅却不足一倍——同等任务下,H100 能效比 A100 高出近两倍。更新的 Blackwell 架构(B200)进一步优化能效。

这如同汽车引擎:新一代马力更强,百公里油耗反而更低。

除通用 GPU 外,还有一类专为 AI 推理设计的芯片叫 ASIC——它不像 GPU 那样“全能”,而是专注单一计算,效率极高。Google 的 TPU 即属此类。研究显示,特定 AI 任务中,ASIC 能耗可低至 GPU 的十分之一。

路线三

数据中心约 30%-40% 的电力非用于计算,而是用于散热。

传统做法是用空调吹冷风——简单但低效。如今越来越多数据中心采用液冷技术——将冷却液直送芯片表面带走热量,散热效率较风冷提升五倍以上。腾讯云数据中心已全面启用液冷,PUE 值降至 1.15 以下。

更有极端方案:将整台服务器浸入冷却液——称为“浸没式液冷”。看似疯狂,实则已在超算中心试点。

另一思路是选址。微软在北欧海底建设数据中心,借海水自然降温。越来越多数据中心落户内蒙古、贵州、北欧、加拿大——非为网速,只为借天然低温减少空调耗电。

路线四

除省电外,还有一条路——不是少用电,而是用更清洁的电。

我国“东数西算”工程正是此逻辑:将数据中心建于西部——那里水电、风电和光伏资源丰富。在国家枢纽节点,新建数据中心绿电使用比例已超 80%。

国家政策也在强力推动:要求国家枢纽节点数据中心 PUE 不超 1.2,非枢纽节点不超 1.25。未达标项目,能评审批无法通过。

Google—承诺 2030 年实现全天候 100% 清洁能源运营

微软—投资小型模块化核反应堆(SMR)为数据中心供零碳电力

中国—2026 年底太阳能发电装机规模预计首次超过煤电

AI 正成为推动可再生能源建设加速的“意外推手”。

路线五

这是最有趣的一条——用 AI 为 AI 省电。

Google 自 2016 年起便利用 DeepMind 的 AI 系统管理数据中心冷却,当时就将冷却耗电降低了 40%。如今,越来越多数据中心利用 AI 算法进行负荷预测与智能调度——提前预判算力需求高低时段,动态调整服务器开关与频率。

犹如智能大楼——有人楼层开灯开空调,无人楼层自动关闭。AI 数据中心正变为这样的“智能大楼”,而管理者正是 AI 自身。

列举这么多途径,一个现实问题浮现:这些办法叠加,能否跑赢 AI 用电量的增速?

坦率而言,目前尚不能。

AI 用电量呈指数级增长——每年翻番。上述每条路都能“减速”,却无一能“刹车”。模型变大、用户增多、应用扩展——省下的电,很快被新增需求吞噬。

但方向明确:更高效的模型、更省电的芯片、更聪明的散热、更绿色的能源、更智能的管理。五路并进,至少能让 AI 增长不以牺牲地球为代价。

AI 费电一事,短期难有一劳永逸之解。但有人在认真求解,且部分方案已见效。

这或许是技术发展的常态——问题与解法总是前后追逐。关键在于,追赶者不能停歇。

你还想了解 AI 的哪些事?留言告诉我。

— END —