烧钱2万亿的AI为何还亏着
你每天用ChatGPT、Claude、deepseek、豆包等工具,可能觉得AI已经渗透到生活的方方面面了。但你有没有想过,支撑这些服务的基建投入,已经砸了2万亿美元,而钱还没赚回来?
我看了Exponential View昨天刚发布的《AI经济状态报告》,这份报告的信息量极大,但我觉得最值得聊的,不是AI有多火、增速有多快,而是报告里那个让人坐不住的核心矛盾:钱砸了2万亿,但还没赚回来。
2万亿是怎么来的
超大规模云厂商,就是微软、亚马逊、谷歌、Meta、Oracle这几家,再加上CoreWeave、Nebius这些新云,从2020年到现在,累计在AI基础设施上的资本开支,到今年底预计将突破2万亿美元。
2万亿
比韩国一年的GDP还多一点
而且这个数字还在加速,2023年之前的资本开支基本是沿着历史趋势走的,AI带来的增量部分,到2026年就多出了5350亿美元。
5350亿
AI额外催出来的基建投资,据报告对比,比美国电信行业全年的资本开支还大
说白了,在可比较的技术浪潮中,从来没有哪个在这么短的时间里,往基础设施里砸过这么多钱。
但砸钱不是问题,问题是这笔账怎么算。
折旧吃掉了81%
报告里有一个数字,值得你盯住看:2026年,超大规模云厂商的AI基础设施折旧费用将接近1110亿美元。而同一时期,这些厂商从AI基础设施上获得的收入,折旧吃掉了大约81%(如果算上全部GenAI收入,这个比例是68%)。剩下多少?19%。
81%
折旧占比
19%
余量
算上全部GenAI收入,折旧占比为68%
你发现没有,这跟咱们日常理解的赚钱完全不是一回事。这就是所谓的余量,薄得像刀片。
你可能会说,19%也是赚啊,收入毕竟覆盖了折旧。没错,报告也确认了这一点:2026年一季度,AI基础设施收入刚刚越过盈亏平衡线,确实能覆盖当期折旧了。但请注意两个关键前提。
▾ 前提一
这只是覆盖了当期折旧,不是收回累计投入。2万亿美元的基建还在账上趴着,累计折旧和累计收入之间还有巨大的缺口。打个比方,你贷款买了一套房,每月租金刚够还月供,但离把房贷还完还远着呢。
▾ 前提二
19%的余量,是在折旧增速还没追上收入增速的时候量出来的。但随着更多在建的AI基础设施投入使用,折旧基数还会继续膨胀。收入增速必须跑赢折旧增速,余量才不会被压缩。这是一场精密的时间赛跑。
钱被谁赚走了
答案是:内存厂商。
报告里有一个变化,极其反常识。2021年,内存在一个数据中心的建设成本里只占2%,基本可以忽略不计。到了2026年,这个比例飙升到18%。四年时间,从2%到18%,翻了9倍。与此同时,芯片的占比从40%涨到60%。
每往数据中心投一块钱
芯片
60%
内存
18%(2021年仅2%)
其他
22%
内存为什么突然变得这么贵?因为大模型的推理和训练,对内存带宽的渴求几乎是无限的。GPU算力再强,数据喂不进去也是白搭。HBM,也就是高带宽内存,成了整个AI基建的命门。三星、SK海力士、美光这三家,基本垄断了HBM的供应。
你看,这就形成了一个很微妙的利润分配格局:云厂商砸下重金建数据中心,英伟达卖GPU赚走一大块,内存厂商又赚走一大块,留给云厂商的利润空间被两头挤压。
华尔街也注意到了这个问题,他们管这叫AI基建的黄金窗口:芯片厂商卖完就确认收入,利润表立刻好看;但云厂商买了芯片要折旧好几年,成本是递延的,利润表暂时还行,但折旧的冲击正在路上。
正因为利润被芯片和内存两头挤压,云厂商的余量才只有19%这么薄。内存厂商不是支线,它是余量为什么这么薄的关键解释。
出路:Token降价能换来多少增长
报告给出的答案,归结到一点:Token降价能不能换来足够多的用量增长?
Token是AI的计费单位,就像电力的度电、电信的流量。报告里有一组数据,谷歌的Token价格下降了97%,但用量增长了50倍。弹性系数大约在1.2到1.8之间,意思是价格每降10%,用量就增长12%到18%。不过这个数字是从价格和用量同步变化的时间趋势中估算的,不是实验室里控制变量测出来的。它说明方向,但不代表精确预测。总花费还在涨,只是涨法变了:从贵而少,变成便宜而多。
历史类比
电灯刚发明的时候,爱迪生按灯泡数量收费;后来有了电表,按度电收费,电力才真正普及。
互联网早期按上网时长收费,后来按流量收费,再后来干脆包月,网民才爆发到几十亿。
AI现在正处于从按灯泡收费到按度电收费的过渡期。Token就是今天的灯泡数,它是一个计费单位,但还不是真正的价值单位。
但这里有一个关键的不确定性:弹性系数1.2到1.8,意味着降价确实能拉动更多用量,但这个弹性能不能持续?会不会降到某个价位之后,边际用量增长就开始衰减?报告没有给出明确答案,因为数据还不够长。这就像你站在2000年问互联网的流量增长能不能持续,当时没人能给出确定回答,只能看趋势。
还有一个变量值得注意:开放权重模型。报告显示,去年的前沿模型,今年就被开放权重模型商品化了。什么意思?OpenAI和Anthropic花了几十亿训练出来的模型,不到一年就有免费的开源替代品追上来。这意味着模型层的定价权很脆弱,除非你能持续站在前沿。而一旦前沿模型的价格被打下来,云厂商在折旧压力之上又多了一层降价压力,收入增速就更难跑赢折旧增速。
可持续吗?一个三变量方程
回到最初的问题:可持续吗?这不是一个能简单回答是或否的问题,而是一个取决于三个变量的方程。
变量一
收入增速能不能跑赢折旧增速
目前刚刚越过盈亏平衡线,余量只有19%,容错空间极小。
变量二
Token降价的弹性能不能维持
弹性在,总花费就在涨,折旧就有收入来覆盖;弹性一旦衰减,收入增速就会掉下来,折旧就会追上来。
变量三
GPU的实际使用寿命能不能超过6年
报告里算过,如果折旧年限从6年延长到9年,余量可以从19%跳到30%以上。扎克伯格在2025年三季度财报电话会上说过一句话,大意是:最坏的情况就是我们提前建了两年的产能,会有一些折旧损失,但最终会增长到那个规模。这句话背后,赌的就是GPU寿命比会计准则规定的更长。
需求是真实的,增速是史无前例的,但回报的时钟在倒计时。
这不是泡沫要破的简单结论,而是一场精密的赛跑:收入增速跑赢折旧增速,就是可持续;跑不赢,账面利润就会被成本追上。
目前刚刚起跑,领先半个身位。