AI下半场新战场：能效制胜

发布时间：2026-05-13 16:03阅读：33

先描绘一个场景。

2025年，美国得州一座新建的AI算力中心旁，巨型柴油发电机日夜不息。

周边数公里内的居民察觉，自家电费悄然上涨。

这并非孤例。

Google、Microsoft、Amazon、Meta四巨头在2025年的AI基建投入，总计将突破2000亿美元大关。

这笔巨资，绝大多数流向了电力消耗。

大模型的军备竞赛已持续数载，此前各方比拼的是参数规模与显卡数量。

然而如今，一个更本质的议题浮出水面：

AI的博弈，正从“跑得快”转向“用得省”。

为何是此刻？

大模型竞争的焦点，正由训练阶段转移至推理阶段。

训练旨在构建模型，推理则是应用模型。

训练期重金购卡，属一次性投入，终点明确。

推理期则是日复一日、分秒不停的调用。用户调用一亿次，推理便发生一亿次。

当大模型迈向日活过亿的产品形态，推理成本便成了决定生死的关键。

每节约一度电，叠加一亿次调用，便是数十亿美元的差距。

这与稀疏计算有何关联？

关联甚大。

传统AI芯片的逻辑是：将所有参数载入，计算时全速开启。

后果便是：运行130B参数模型时，H100 GPU功耗高达数百瓦，大量电能浪费在“沉默参数”上——即那些与当前输入毫无关联的权重。

稀疏计算的思路则是：仅激活与当前任务相关的电路，其余一律关闭。

这好比阅读文章，无需逐字通读即可理解。大脑自动跳读，仅处理核心信息。

大模型亦可效仿此法。

谁在重仓这一赛道？

Groq是近期备受瞩目的范例。

其LPU芯片以稀疏计算为架构核心，运行70B参数模型时，速度超H100十余倍，功耗却大幅降低。

并非芯片算力更强劲，而是它绝不浪费算力去计算无需处理的部分。

Etched更为激进：直接将Transformer架构固化于ASIC芯片中，专攻一事，做到极致。

这一方向，巨头亦在跟进。

Google在Gemini中大规模采用MoE架构，本质即为稀疏计算：2000亿参数模型，每次推理仅激活200亿，其余处于休眠状态。

Dense Scaling已遇瓶颈。边际收益递减，电费却不会随之减少。

行业天平，正倾向“节能”。

为何“节能”成为下一代AI的胜负手？

原因有三。

其一，电力是最硬的约束。

美国多州已现AI数据中心申请因电网容量受限而被拒的情况。

得州电力公司更直接要求，新建数据中心容量预留须提前18个月申报。

电网若跟不上，算力增长将撞上物理天花板。

在“无法堆叠显卡”的局限下，每度电的产出效率，才是真实的竞争维度。

其二，节能方能省钱，省钱方可规模化。

大模型欲成真正的基础设施，成本须降至可大规模商用水平。

GPT-4级推理，当前单次成本约为Google搜索的十倍。

若推理成本无法下降，大模型的规模化应用便是空谈。

节能直接带动降本，降本方能推动规模化。

其三，能源瓶颈背后暗藏地缘政治。

全球AI算力之争，实为电力基础设施之争。

美国数据中心争夺电网容量，沙特以石油美元购置算力，阿联酋争夺全球顶级算力基建。

能源，正演变为AI时代新型战略资源。

谁能解决“节能”难题，谁便掌握了时代最稀缺的能力之一。

这对GP而言意味着什么？

一级市场已率先反应。

Groq、Etched等新一代AI芯片公司，估值正急速攀升。

围绕推理优化的软件层正孕育一批新创：稀疏推理框架、芯片调度优化、垂直场景定制。

但筛选项目标准需明确：

一看团队是否具备从算法到硬件的协同优化能力，而非仅在GPU上套壳。

二看产品能否在特定场景中将节省的算力转化为可量化的商业价值。

三看与大厂生态的竞合关系，唯有切入大厂不愿涉足的细分场景方有生存空间。

大模型竞争，上一章比拼的是“谁能造出”。

下一章较量的是“谁能使其运行更廉价”。

当行业开始认真算账，节能的价值将被重新定价。

欲了解更多硬科技赛道投资逻辑？