AI 编程:颠覆万亿市场的变革力量
科技界有个流传甚广的说法:数字不会撒谎,但擅长撒谎的人会编造数字。
然而,有些数字的惊人程度,连最巧舌如簧的说谎者也难以杜撰。
高达 440 亿美元。
这是 Anthropic 公司在 2026 年 5 月公布的年化经常性收入(ARR)。如果这个数字让你感到模糊,不妨回顾一下软件行业的发展轨迹:亚马逊云服务(AWS)耗费了 13 年才达到 350 亿美元的年收入;Salesforce 自 1999 年成立以来,直到 2021 年才突破 200 亿大关;ServiceNow 则用了大约 20 年才迈过 90 亿美元的门槛。
Anthropic 仅用了一年时间。
这已非简单的增长,而是对现有物理法则的重新定义。
在 2025 年底,Anthropic 的 ARR 还在 90 亿美元左右徘徊。到了 2026 年 5 月,这一数字已飙升至 440 亿。粗略计算,这意味着平均每天新增约 9600 万美元的收入。其中最为迅猛的增长发生在 2026 年 2 月之后——短短三个月内,ARR 从 140 亿一跃至 440 亿。SaaS 领域从未出现过如此陡峭的增长曲线。
而驱动这台收入增长引擎的核心动力,便是 Claude Code——一款人工智能编程工具。
Claude Code 于 2025 年 5 月开始公测,到 2026 年 2 月,其年化收入已达到 25 亿美元,并且仍在加速增长。自 2026 年 1 月以来,每周活跃用户数量翻了一番。据估计,全球约有 4% 的 GitHub 代码提交是由 Claude Code 生成或辅助完成的。
因此,一个悬而未决两年多的问题终于有了答案:人工智能的商业闭环究竟在哪里?
第一个实现大规模落地的应用,正是 AI 编程。
这已经不再是“看起来有前景”,而是“获得了真金白银的认可”。
故事的有趣之处在于,Anthropic 的爆发并非孤立事件,而是发生在一场充满权力角逐、算力竞争和巨头投资的戏剧性事件之中。
2026 年 5 月 6 日,埃隆·马斯克在同一天公布了两项重大消息:xAI 将不再作为独立公司运营,而是整合进 SpaceX 并更名为 SpaceXAI;同时,SpaceX 将其位于田纳西州孟菲斯的 Colossus 1 数据中心的所有计算能力租给了 Anthropic。
这是一笔何等规模的交易?Colossus 1 拥有超过 22 万张英伟达 GPU 和 300 兆瓦的电力容量。Anthropic 获得了全部容量,并在协议中还“表达了在太空开发多吉瓦级计算基础设施的意向”。
更值得玩味的是合作的时机。就在几周前,马斯克还在 X 平台上批评 Anthropic,称其“注定成为自身名字的反面”、“还有比 Anthropic 更虚伪的公司吗?”。然而,在合作宣布当天,马斯克话锋一转,表示自己过去一周与 Anthropic 高层进行了深入交流,“印象非常深刻,没有人触发我的邪恶探测器。”
这是为何?因为算力不足了。
在此之前,Anthropic 的用户早已感受到“不可避免的基础设施压力”——Claude 在高峰时段频繁出现限流和性能问题。Colossus 1 的接入几乎是同步地让 Anthropic 宣布放宽限制:Claude Code 的 Pro、Max、Team 及企业版用户的 5 小时率限制翻倍;Opus API 的速率限制大幅提升;Pro 和 Max 用户的高峰时段限制被完全解除。
但这个故事中最具深意的一点,在于算力的提供方——xAI——的处境。
2023 年,马斯克亲自组建了一支由 AI 领域顶尖人才组成的创始团队:汇聚了来自 Google DeepMind、OpenAI、微软研究院的 11 位联合创始人。三年后的 2026 年 3 月底,这 11 个人全部离职,无一幸免。最后一个离开的是被内部称为马斯克“左膀右臂”的 Ross Nordeen——他不仅是公司的运营总管,更是主导搭建了 Colossus 超级计算集群的数据中心架构师。连他都离开了,事情的性质已不言而喻。
更显尴尬的是硬件的利用率。据报道,xAI 的算力利用率仅为 11%,处于业界最低水平。而 2026 年 3 月 13 日,马斯克罕见地公开承认:“xAI 第一次没做对,需要从头开始重建。” 同一周,他在公开场合表示 Grok 的编程能力“已经落后了”。
这构成了一幅极具讽刺意味的画面:马斯克凭借强大的意志力在 122 天内建成了全球最大的超级计算集群,但最优秀的人才却在这座算力堡垒中纷纷选择离开。人工智能的核心竞争力并非 GPU 芯片、数据中心或巨额资金——而是那些能够署名于论文第一作者位置的人才。马斯克最擅长的是将不可能变为可能,但这一次他面对的不是物理定律,而是人心。
就在 xAI 进行重组的同时,另一边的科技巨头已经下了重注。
2026 年 4 月 24 日,谷歌宣布将向 Anthropic 投资高达 400 亿美元。首批 100 亿美元现金以 3500 亿美元的估值注入,后续还将追加 300 亿美元,前提是 Anthropic 达到业绩目标。在此之前,亚马逊刚刚向 Anthropic 追加了 50 亿美元投资,并签署了价值 1000 亿美元的长期云服务协议。
谷歌的操作尤其引人深思。谷歌自身拥有 Gemini,并且是全球排名前三的人工智能模型提供商。然而,它依然选择向 Anthropic 投入 400 亿美元。
这并非单纯的财务投资。这更像是在购买一份“保险单”——确保无论最终在编程 AI 赛道上谁能胜出,谷歌都将是赢家股东名单中的一员。这是一种“双向押注”的极致策略:一方面发展自己的模型,另一方面投资最强的竞争对手。谷歌并非不怕失败,而是它输不起。
这种确定性,不仅体现在独角兽公司的估值之中,更深刻地烙印在云服务提供商的财务报告里。
2026 年第一季度,三大云服务提供商的财报呈现出一场显著的分化。Google Cloud 以 63% 的增速位居榜首,而其未履行合同(Backlog)——高达 4620 亿美元——更是令人瞩目。Sundar Pichai 在财报电话会议上直言,当前的瓶颈不在于需求,而是供给能力不足。
微软 Azure 增速为 40%,年化 AI 收入达到 370 亿美元,拥有最完整的生态系统,但在此次增长势头中被谷歌的表现所超越。AWS 增速为 28%,规模依然是最大的(年化运行率约 1500 亿美元),但其增速在三者中是最低的——这或许是大体量公司转型所付出的代价。
三大云服务巨头的 CEO 在财报电话会议上不约而同地强调了同一件事:人工智能是推动云业务增长的核心驱动力。Sundar Pichai、Satya Nadella 和 Andy Jassy 这三位平时在任何细节上都力争压倒对手的领导者,却在 AI 驱动增长这一点上达成了罕见的共识——这其中的含义不言而喻。
根据 Exponential View 的分析,人工智能收入在 Google Cloud 的占比已接近 23%,Azure 约占 10%(其中大部分来自 OpenAI),AWS 约占 5%。需要注意的是,这些数据是 2026 年初的,按照人工智能的增长速度,目前的比例只会更高。
回顾 2025 年,当时的市场气氛远没有现在这般乐观。
在那一年,“AI 泡沫论”是科技界最流行的讨论话题。《金融时报》发表了超过百篇带有“AI bubble”关键词的文章。电影《大空头》的原型人物 Michael Burry 公开做空英伟达和 Palantir,并预言“几乎所有的 AI 公司都将破产,大量的 AI 支出将被冲销”。高盛发出警告,称 AI 正在形成一个“封闭的资金循环”——科技公司之间相互投资,资金在几家巨头间流转,但终端客户的实际付费并未跟上。
泡沫论的核心逻辑其实非常简单:资本支出(CAPEX)正在急剧增长,但实际收入并未同步提升。四大科技巨头(亚马逊、微软、谷歌、Meta)在 2026 年的合计资本支出预计将达到 6950 至 7250 亿美元,而当时可见的企业级 AI 付费,更多还停留在“聊天机器人”的层面。
那时候人们最常问的问题是:投入了数千亿美元购买 GPU,除了写几首蹩脚的诗和生成几张手指不协调的图片,AI 到底能带来多少回报?
坦白说,当时这个问题的答案是:“还不确定。”
但现在,答案已经揭晓。AI 编程以一种极其震撼的方式回应了泡沫论。
当 AI 能够直接接管软件开发这个价值万亿美元的市场,并迅速转化为企业级订阅收入时,“商业循环缺乏闭环”的质疑在真实的现金流面前显得有些苍白。Exponential View 的分析师 Azeem Azhar 在最新的评估中给出了一个清晰的判断:“泡沫论可以暂时告一段落了。AI 已从实验阶段转变为基础设施。”
他的分析框架显示,投资与收入之比(行业压力指数)已从 5 个月前的 6.1 倍下降到 4.7 倍。如果这一趋势得以维持,到 2026 年第二季度将降至 3 倍以下——届时意味着收入已经真正“承接”了此前投入的基础设施。
而且,受到 AI 编程改变的不仅仅是硅谷的创业者,还包括那些最保守的企业。美国银行——这家拥有 120 年历史的老牌银行——报告称 AI 编程工具将其开发时间缩短了 30%,相当于节省了 2000 名全职工程师的工作量。挪威管理着 2 万亿美元主权财富基金,通过使用 Claude 实现投资组合监控自动化,每年节省约 1700 万至 3200 万美元的人力成本。Meta 公司报告称,自 2025 年 1 月以来,工程产出提升了 30%,其中重度用户的使用效率提升了 80%。
Exponential View 的分析团队在深入分析了超过 6000 份标普 500 公司财报电话会议记录后,提取了近 3 万条与 AI 相关的信息。他们发现,能够在财报电话会议上提供 AI 应用量化数据的公司比例,已从 1.9% 飙升至 13.2%。其中大多数效率提升听起来并不“令人兴奋”——例如客服分流率的提高、开发时间的缩短、运营成本的降低。但正是这种“不起眼”的改进,才代表着真正的普及。
至此,一个更深层次的问题浮现出来:为什么 AI 首先在编程领域实现了规模化的商业成功,而不是在医疗、法律、金融,或者看似更简单的旅游规划领域?
前 OpenAI 联合创始人 Andrej Karpathy 提出的解释,可能是目前为止该行业最重要的见解之一。
他认为,AI 编程之所以能够率先实现商业化落地,关键在于两点。
第一,编程拥有“明确且可验证的奖励函数”(Reinforcement Learning with Verifiable Rewards,RLVR)。代码的质量好坏,不需要人类专家进行主观评价——只需直接运行,检查测试用例是否通过,结果是二元的:正确或错误。这一看似简单的特性,使得 AI 模型能够通过强化学习实现极其高效的自我进化。模型可以自行编写代码、运行、评估结果,并在“通过”与“未通过”的反馈中快速迭代。
这听起来简单,但它代表了 AI 训练领域的一场革命。传统的 AI 训练需要大量人工标注数据,而编程领域的“标注”是自动化的——编译器不会出错,测试不会说谎。
第二,B2B 价值极高。在企业环境中,编程效率的提升直接转化为经济效益——降低人力成本、缩短产品迭代周期、压缩 bug 修复时间。这种价值是可量化的、可预测的,因此企业愿意为此支付高昂的费用。Anthropic 的推理基础设施毛利率从一年前的 38% 跃升至超过 70%,这本身就说明了其商业模式的持续改善。
而 AI 编程之所以被形容为“暴力美学”,正是因为这种“可验证性”带来的独特工作方式:它知识渊博——几乎掌握所有编程语言、框架、库的使用方法;速度惊人——能在几十秒内完成一个完整的模块;但它也“有些笨拙”——在深层架构设计上,缺乏对系统长期演进的全局把握,有时会写出能够运行但设计不佳的代码。
然而,AI 不怕“笨”,它怕的是“不确定”。可验证的编程任务,恰恰是最确定的。
作为对比,看看 AI 在旅游规划上的表现,就能清晰地理解其中的差异。
CNBC 在 2026 年 3 月的一项调查描绘了一个令人沮丧的场景。一位旅客在巴黎出差,让 ChatGPT 规划前往会议地点的路线。AI 自信满满地提供了一条捷径——但它未能考虑到前方道路因施工而封闭的情况。原本只需 10 分钟的路程,却变成了长达 45 分钟的煎熬。
Savanti Travel 的旅行顾问 Leigh Rowan 一针见血地指出:“这些看起来像是极端个例,但实际上非常普遍。”
CNN 的一档节目也报道了类似的问题:AI 在旅游规划中会推荐不存在的餐厅、忽略季节性的天气变化、无法处理多代同堂家庭出行中行动不便的长辈的需求。
问题出在哪里?缺乏可验证的奖励函数。什么样的行程才是“完美”的?这是一个主观问题。道路是否封闭?地标是否真实存在?信息实时且碎片化。在规划阶段,你无法像运行一段代码那样即时验证其对错。
Klook 的调查数据显示了更直观的对比:91% 的全球旅行者在使用 AI 规划工具,但 Booking.com 的另一份报告显示,同样有 91% 的人对 AI 生成的结果表示担忧,只有 35% 的人完全信任它。
这就是差距所在。AI 编程的试错成本是短暂的计算时间;而 AI 旅游规划的试错成本则可能是一个被浪费的假期、一次错过的会议、或者是在巴黎街头焦头烂额的商务旅客。
编程为 AI 提供了一个完美的训练场和完美的商业场景,而旅游规划则为 AI 设置了一个充满陷阱的“不确定性沼泽”。这两种表现的对比,不仅仅是一个技术故事,更是一个关于“AI 能做什么和不能做什么”的深刻原理阐释。
回到行业格局。
目前,谷歌和 Anthropic 在 AI 编程的竞赛中暂时处于领先地位。Google Cloud 拥有强大的基础设施(4620 亿美元的 backlog 就是明证),而 Anthropic 则拥有最符合企业级需求的产品。两者的合作,正在蚕食 AWS 和 Azure 的新增市场份额。
但这种格局是否稳固?远非如此。
首先,开源模型的追赶速度令人惊叹。2026 年 4 月,小米 AI 负责人罗福莉带领团队推出的 MiMo-V2.5-Pro 模型,在编程基准测试中超越了 DeepSeek V4 Pro,并以 MIT 协议开源。发布首日,该模型已被七家国内芯片厂商集成。罗福莉在之前的深度访谈中曾指出一个关键趋势:在强化学习的范式下,模型之间的差距并非在拉大,而是在缩小。原因很简单:RL 本身就是一个“追赶型”的训练方法——只要存在足够好的奖励信号,后来者可以比先行者更快地实现突破。
其次,编程场景的特殊性决定了“顶尖模型”难以形成垄断。代码是高度敏感的。企业不太可能将核心代码库的全部权限交给任何一个第三方的云端 AI。本地部署、开源模型、自托管——这些需求将自然而然地促使市场形成多极化格局。微软、亚马逊以及国内的云服务厂商都不会轻易放弃这块市场。Cursor 等独立工具依然拥有庞大的用户群体,Anthropic 的领先优势可能会被市场结构本身的分散性所稀释。
更重要的是,模型能力的“天花板效应”已经若隐若现。罗福莉在张小珺的深度访谈中直言,强化学习的范式本身是一把双刃剑:它让所有人都能以更低的成本实现追赶,但也意味着单纯依赖预训练的 Scaling Law 已经达到了边际效益递减的阶段。未来的竞争将从“谁的模型更强大”转向“谁的落地能力更出色”,从比拼参数数量转向比拼工程实现能力。
一个时代正在被颠覆。
旧的软件开发模式是“人编写代码,机器执行”。未来的模式将是“人定义目标,AI 暴力执行”。程序员并非注定失业——他们的角色正在从“打字员”转变为“问题定义者”。
这场重构涉及的是一个万亿美元级别的市场。Google Cloud 的 4620 亿美元 backlog 只是一个侧面,它背后是整个软件行业正在被 AI 重新定价的现实。
Anthropic 的 440 亿美元 ARR、马斯克的算力帝国、谷歌的 400 亿美元投资、Karpathy 提出的“可验证奖励函数”理论,以及巴黎街头那位被 ChatGPT 带错路的商务旅客——所有这些零散的片段汇聚在一起,讲述的都是同一个故事:AI 的商业化并非泛泛地“赋能一切”,而是在那些具备确定性反馈的领域,以一种近乎“暴力美学”的方式逐一攻破。
AI 的确定性就在于此:它并非无所不能,而是在那些它能够胜任的领域,其表现之出色足以令人瞠目结舌。
在下一篇文章中,我们将继续探讨其他“确定性领域”的突破——以及那些暂时还未看到突破的领域,为何会停滞不前。