AI下半场新战场:能效制胜
先描绘一个场景。
2025年,美国得州一座新建的AI算力中心旁,巨型柴油发电机日夜不息。
周边数公里内的居民察觉,自家电费悄然上涨。
这并非孤例。
Google、Microsoft、Amazon、Meta四巨头在2025年的AI基建投入,总计将突破2000亿美元大关。
这笔巨资,绝大多数流向了电力消耗。
大模型的军备竞赛已持续数载,此前各方比拼的是参数规模与显卡数量。
然而如今,一个更本质的议题浮出水面:
AI的博弈,正从“跑得快”转向“用得省”。
为何是此刻?
大模型竞争的焦点,正由训练阶段转移至推理阶段。
训练旨在构建模型,推理则是应用模型。
训练期重金购卡,属一次性投入,终点明确。
推理期则是日复一日、分秒不停的调用。用户调用一亿次,推理便发生一亿次。
当大模型迈向日活过亿的产品形态,推理成本便成了决定生死的关键。
每节约一度电,叠加一亿次调用,便是数十亿美元的差距。
这与稀疏计算有何关联?
关联甚大。
传统AI芯片的逻辑是:将所有参数载入,计算时全速开启。
后果便是:运行130B参数模型时,H100 GPU功耗高达数百瓦,大量电能浪费在“沉默参数”上——即那些与当前输入毫无关联的权重。
稀疏计算的思路则是:仅激活与当前任务相关的电路,其余一律关闭。
这好比阅读文章,无需逐字通读即可理解。大脑自动跳读,仅处理核心信息。
大模型亦可效仿此法。
谁在重仓这一赛道?
Groq是近期备受瞩目的范例。
其LPU芯片以稀疏计算为架构核心,运行70B参数模型时,速度超H100十余倍,功耗却大幅降低。
并非芯片算力更强劲,而是它绝不浪费算力去计算无需处理的部分。
Etched更为激进:直接将Transformer架构固化于ASIC芯片中,专攻一事,做到极致。
这一方向,巨头亦在跟进。
Google在Gemini中大规模采用MoE架构,本质即为稀疏计算:2000亿参数模型,每次推理仅激活200亿,其余处于休眠状态。
Dense Scaling已遇瓶颈。边际收益递减,电费却不会随之减少。
行业天平,正倾向“节能”。
为何“节能”成为下一代AI的胜负手?
原因有三。
其一,电力是最硬的约束。
美国多州已现AI数据中心申请因电网容量受限而被拒的情况。
得州电力公司更直接要求,新建数据中心容量预留须提前18个月申报。
电网若跟不上,算力增长将撞上物理天花板。
在“无法堆叠显卡”的局限下,每度电的产出效率,才是真实的竞争维度。
其二,节能方能省钱,省钱方可规模化。
大模型欲成真正的基础设施,成本须降至可大规模商用水平。
GPT-4级推理,当前单次成本约为Google搜索的十倍。
若推理成本无法下降,大模型的规模化应用便是空谈。
节能直接带动降本,降本方能推动规模化。
其三,能源瓶颈背后暗藏地缘政治。
全球AI算力之争,实为电力基础设施之争。
美国数据中心争夺电网容量,沙特以石油美元购置算力,阿联酋争夺全球顶级算力基建。
能源,正演变为AI时代新型战略资源。
谁能解决“节能”难题,谁便掌握了时代最稀缺的能力之一。
这对GP而言意味着什么?
一级市场已率先反应。
Groq、Etched等新一代AI芯片公司,估值正急速攀升。
围绕推理优化的软件层正孕育一批新创:稀疏推理框架、芯片调度优化、垂直场景定制。
但筛选项目标准需明确:
一看团队是否具备从算法到硬件的协同优化能力,而非仅在GPU上套壳。
二看产品能否在特定场景中将节省的算力转化为可量化的商业价值。
三看与大厂生态的竞合关系,唯有切入大厂不愿涉足的细分场景方有生存空间。
大模型竞争,上一章比拼的是“谁能造出”。
下一章较量的是“谁能使其运行更廉价”。
当行业开始认真算账,节能的价值将被重新定价。
欲了解更多硬科技赛道投资逻辑?
关注我们,掌握最新市场行情!