DeepSeek 破局:AI Agent 的账单危机
小王 Eng2026 年 5 月 24 日
本周浏览 Reddit 时,r/artificial 板块有一篇帖子热度颇高,获赞近千 🏄
标题直言不讳,「微软终止内部 Anthropic 授权,Token 计费模式数个月内耗尽年度预算」。
评论区热度最高的留言称,「AI 成本已高到连微软都难以承受。很高兴看到我和微软竟有共同点。」
暂且将其视为社区探讨,并非官方定论。该帖引自某科技博客综述,既无微软公告也缺内部备忘录。亦有评论指出,微软正大力推广自家 GitHub Copilot,不能简单归结为「成本过高」。
然而,该帖是否为实锤,其实无关紧要。
关键在于它揭示了一个事实。
AI Agent 的财务账目,即将难以为继。
过去一年,众人皆谈论 Agent 的强大。Claude Code 能自主编写代码。Cursor Agent 可自行启动虚拟机运行测试。Grok Build 仅需一行命令即可部署自主 Agent。Cursor 工程负责人曾公开表示,公司 30% 的合并 PR 现由 Agent 自动完成,人类仅负责审查。
能力层面确实惊人。
但鲜有人认真核算另一笔账。这些 Agent 运行时,每日耗费几何。
Reddit 该帖下,有一条评论令我反复研读。一位开发者称,其公司强制推行 AI 工具后,重度用户单月 Token 消耗飙升至 8,000 美元。
8,000 美元。相当于一名初级工程师的月薪。
企业 AI 支出已达原预算的 2 至 4 倍。财务部门开始追问,「你本月消耗的 Token 究竟产出了什么价值」。
还有一条评论表述更为直白,「按 Token 计费在初期表现优异,直至你的工程流程依赖 AI 自动补全每日运行上万次」。
不妨算一笔细账。
偶尔向 ChatGPT 提问,按 Token 付费成本低微可忽略不计。但你将 AI 嵌入工作流,让其自动补全、修复 Bug、运行测试、提交 PR,那么,计费器便绑定在了一条永不停歇的流水线上。
AI Agent 的真正瓶颈并非能力。
Claude Opus 4.6 编写代码的能力已超越许多拥有三年经验的工程师。DeepSeek V4-Pro 在多项基准测试中追平甚至超越 GPT-5。Garry Tan 周末自行微调了 Qwen3.5-397B,发推赞叹其令人印象深刻。
能力层面毫无问题。
瓶颈在于经济账。若让一个足够强大的 Agent 自主运行,其产生的账单可能比它所替代的人力成本更高。
Reddit 上有人将此称为「补贴型演示定价」。
2015 年的 Uber 亦是如此。五元从国贸至望京,让你弃用公交卡。补贴取消后,每日打车费超过午餐费,但你已无公交卡可用。
如今的 AI 正如 2015 年的 Uber。
大模型厂商燃烧风险投资将 Token 价格压至近乎免费。开发者纷纷部署 Agent。问题在于,当资金耗尽、公司必须盈利时,账单将呈现何种形态。
如今信号已然显现。
四大行今年 AI 资本支出达 7,250 亿美元,同比增长 77%。
随后 DeepSeek 出手了。
5 月 22 日,DeepSeek 宣布 V4-Pro 的 75% 折扣由临时促销转为永久定价。输入端 0.435 美元/百万 Token,输出端 0.87 美元。有人核算,同等能力级别下,较 Claude Opus 4.7 便宜 28 至 100 倍。
这并非烧钱补贴。V4-Pro 降价的底气源于架构硬实力,推理计算量降至上一代的 27%,缓存开销压至 10%。这是依靠真实效率提升换来的价格,而非风险投资。
这是 Uber 补贴逻辑的反转。它证明了「低价」与「可持续」可并存。
AI Agent 的账单难题,答案或许不在硅谷
X 平台上有一种观点我虽不完全认同,但值得在此提及,「永久折扣并非庆典,而是承认无人愿付全价」。
但换个角度思考,若原价本就应如此呢?若过去两年全行业的定价,是被几家美国实验室定义的虚高水位呢?
整个 AI 行业对此视而不见。
发布会总在强调基准测试提升几个点、上下文窗口扩展多长、推理速度加快多少。无人上台直言,「经测算,Agent 自主工作一日成本已超雇佣一人」。
回归国内现状。
近期传闻四起。
「个人中间商已死,入场即受骗,属夕阳产业」。「中转仍在盈利,初期提供 Claude,后期切换至某谱」。
媒体号上的舆论风向已变。不再是「AI 真厉害」,亦非「风口来临快上车」。关键词变为骗子、已死、夕阳产业。
Token 中间商赛道,互联网信任至少已崩塌。
去年此时,网络舆论遍地「AI 风口」「抢占红利」。今年开始系统反思。并非因 AI 不够强大。恰恰相反,是因 AI 足够强大,成本结构肉眼可见,人们发现其虽好,却用不起或不知如何靠其盈利。
另有现象佐证,AI 产业链内容已彻底金融化。
「CPO 和存储之后,芯片上桌了」获 7,000+ 赞的帖子,评论区全在讨论明日能否建仓、光模块涨跌、科创芯片能否入场。数十条评论,无一条探讨技术,全在讨论股票代码。
中文社区对 AI 的关注,已从「它能做什么」转变为「我如何从中获利」。当获利讨论全集中于二级市场而非应用层时,应用层商业化的难度便可想而知。
回归 AI Agent 的账单问题。
并非想说「AI 太贵所以不行」。逻辑非此。
AI Agent 正处于一个极其微妙的节点。
能力层面,已能替代许多人的工作。Cursor Agent 自主写代码、测试、提 PR,一年前尚是天方夜谭。成本层面,正从 VC 补贴的演示价滑向真实商业定价。在真实价格下,究竟有多少 Agent 工作流具备经济可行性,无人知晓。或者说,无人愿公开言说。
这才是 2026 年 AI 行业最应探讨的问题。非 GPT-6 何时发布,非基准测试又升几点,非哪个新模型再次「震撼发布」。
当我们将 AI 从「偶尔使用的聊天工具」转变为「自主运行的 Agent」后,谁来买单?买得起吗?
云计算历史是一面很好的镜子。2010 年皆高呼「上云」,无人计算三年后账单。当 AWS 账单寄到家门口,一批公司又开始「下云」。
AI Agent 大概率将重走此路。
且速度更快。
云计算至少设有预算上限,超标即停。AI Agent 若设预算上限,运行至一半,代码写一半,测试跑一半,PR 提一半,该如何应对?你不得不再掏钱让其跑完。
这正是基于 Token 计费最危险之处。非固定月费,而是与使用量正相关的变量。你越依赖它,使用量增长越快,价格敏感度越低。
Reddit 上有人言,「他们在等你上瘾后再涨价」。
等你上瘾了再提价。
写至此处想起上周四。Elon Musk 发布了 Starship 第十二次试飞的实时画面,由 Starlink 卫星拍摄。
SpaceX 耗时十余年,从一次性火箭到助推器回收,再到星舰复用。每一步都在降低「单次飞行」成本至可持续水平。
AI Agent 如今宛如早期火箭。单次飞行昂贵。单次飞行震撼。但无人知晓如何实现「复用」。
非技术复用。而是经济复用。使每次 Agent 运行成本低于其创造价值。
造火箭至少物理定律已知。AI Agent 商业化,你甚至不知明年价格曲线走向。
但此路必须走通。否则 AI Agent 永远仅是演示。令人兴奋的演示。让 VC 狂喜的演示。让开发者惊叹的演示。但非能存活的产品。
回归 DeepSeek。
Starship 耗时十余年让「单次飞行」变便宜。但在 AI 领域,有人正以架构创新做同一件事,且已跑通。
「我虽不用 DeepSeek,但愿其持续强劲。它划下红线,凡性能相当、价格相近甚至更高的产品,皆无法生存」。
请细品。非「DeepSeek 便宜我要用」。而是「我不用的产品,正帮我压制我用的产品价格」。
此即鲶鱼效应。
全球 AI 定价体系过去两年由几家美国实验室定义。OpenAI 定何价,Anthropic 定何价,市场便接受何价。无人询问,此价格是否合理。DeepSeek 一刀砍掉 75% 且能盈利,等于将此问题甩给所有人。若我能以此价销售仍有利润,你卖如此高价,钱去哪了?
「闭源阵营压力爆棚,打赢无奖,打输即死」。
红线一旦划定,所有售价高于它的模型必须回答同一问题:你的溢价,买的是什么?答不上来,要么降价,要么淘汰。
定价权正在转移——硅谷定价权 vs DeepSeek 的红线
AI Agent 的账单难题,答案或许不在硅谷,而在杭州。
来,总结一下。
无论微软因何终止内部 Anthropic 授权,其暴露的问题属实。基于 Token 计费在工程工作流中的预算不可预测性,已大到连最富有的科技公司都在重新审视「我们是否用得起」。
但 Reddit 该帖下另一句话,可能比所有吐槽更重要。
「不知有多少公司正悄悄撞上这堵墙」。
我想说的是,这堵墙不会自行消失。但也并非无解。
DeepSeek 划下的红线,便是有人在墙上开出的第一扇窗。非靠 VC 烧钱凿出,而是靠架构创新一刀刀凿出。它证明了两件事。前沿模型可以很便宜。低价与可持续可并存。
全球 AI 定价体系,正被一个内部变量撬动。硅谷实验室可继续视而不见,但市场不会。前述那条红线,便是最好的答案。
此非技术问题。
是经济模型问题。
而经济模型问题,市场自会给出答案。
AI Agent 真正的瓶颈非能力。
是账单。
但账单,正在被解决。
就此打住,望对大家有益。欢迎点赞、分享、推荐三连。❤️
/ 作者:小王 Eng