AI 编程：颠覆万亿市场的变革力量

发布时间：2026-05-09 06:57阅读：25

科技界有个流传甚广的说法：数字不会撒谎，但擅长撒谎的人会编造数字。

然而，有些数字的惊人程度，连最巧舌如簧的说谎者也难以杜撰。

高达 440 亿美元。

这是 Anthropic 公司在 2026 年 5 月公布的年化经常性收入（ARR）。如果这个数字让你感到模糊，不妨回顾一下软件行业的发展轨迹：亚马逊云服务（AWS）耗费了 13 年才达到 350 亿美元的年收入；Salesforce 自 1999 年成立以来，直到 2021 年才突破 200 亿大关；ServiceNow 则用了大约 20 年才迈过 90 亿美元的门槛。

Anthropic 仅用了一年时间。

这已非简单的增长，而是对现有物理法则的重新定义。

在 2025 年底，Anthropic 的 ARR 还在 90 亿美元左右徘徊。到了 2026 年 5 月，这一数字已飙升至 440 亿。粗略计算，这意味着平均每天新增约 9600 万美元的收入。其中最为迅猛的增长发生在 2026 年 2 月之后——短短三个月内，ARR 从 140 亿一跃至 440 亿。SaaS 领域从未出现过如此陡峭的增长曲线。

而驱动这台收入增长引擎的核心动力，便是 Claude Code——一款人工智能编程工具。

Claude Code 于 2025 年 5 月开始公测，到 2026 年 2 月，其年化收入已达到 25 亿美元，并且仍在加速增长。自 2026 年 1 月以来，每周活跃用户数量翻了一番。据估计，全球约有 4% 的 GitHub 代码提交是由 Claude Code 生成或辅助完成的。

因此，一个悬而未决两年多的问题终于有了答案：人工智能的商业闭环究竟在哪里？

第一个实现大规模落地的应用，正是 AI 编程。

这已经不再是“看起来有前景”，而是“获得了真金白银的认可”。

故事的有趣之处在于，Anthropic 的爆发并非孤立事件，而是发生在一场充满权力角逐、算力竞争和巨头投资的戏剧性事件之中。

2026 年 5 月 6 日，埃隆·马斯克在同一天公布了两项重大消息：xAI 将不再作为独立公司运营，而是整合进 SpaceX 并更名为 SpaceXAI；同时，SpaceX 将其位于田纳西州孟菲斯的 Colossus 1 数据中心的所有计算能力租给了 Anthropic。

这是一笔何等规模的交易？Colossus 1 拥有超过 22 万张英伟达 GPU 和 300 兆瓦的电力容量。Anthropic 获得了全部容量，并在协议中还“表达了在太空开发多吉瓦级计算基础设施的意向”。

更值得玩味的是合作的时机。就在几周前，马斯克还在 X 平台上批评 Anthropic，称其“注定成为自身名字的反面”、“还有比 Anthropic 更虚伪的公司吗？”。然而，在合作宣布当天，马斯克话锋一转，表示自己过去一周与 Anthropic 高层进行了深入交流，“印象非常深刻，没有人触发我的邪恶探测器。”

这是为何？因为算力不足了。

在此之前，Anthropic 的用户早已感受到“不可避免的基础设施压力”——Claude 在高峰时段频繁出现限流和性能问题。Colossus 1 的接入几乎是同步地让 Anthropic 宣布放宽限制：Claude Code 的 Pro、Max、Team 及企业版用户的 5 小时率限制翻倍；Opus API 的速率限制大幅提升；Pro 和 Max 用户的高峰时段限制被完全解除。

但这个故事中最具深意的一点，在于算力的提供方——xAI——的处境。

2023 年，马斯克亲自组建了一支由 AI 领域顶尖人才组成的创始团队：汇聚了来自 Google DeepMind、OpenAI、微软研究院的 11 位联合创始人。三年后的 2026 年 3 月底，这 11 个人全部离职，无一幸免。最后一个离开的是被内部称为马斯克“左膀右臂”的 Ross Nordeen——他不仅是公司的运营总管，更是主导搭建了 Colossus 超级计算集群的数据中心架构师。连他都离开了，事情的性质已不言而喻。

更显尴尬的是硬件的利用率。据报道，xAI 的算力利用率仅为 11%，处于业界最低水平。而 2026 年 3 月 13 日，马斯克罕见地公开承认：“xAI 第一次没做对，需要从头开始重建。” 同一周，他在公开场合表示 Grok 的编程能力“已经落后了”。

这构成了一幅极具讽刺意味的画面：马斯克凭借强大的意志力在 122 天内建成了全球最大的超级计算集群，但最优秀的人才却在这座算力堡垒中纷纷选择离开。人工智能的核心竞争力并非 GPU 芯片、数据中心或巨额资金——而是那些能够署名于论文第一作者位置的人才。马斯克最擅长的是将不可能变为可能，但这一次他面对的不是物理定律，而是人心。

就在 xAI 进行重组的同时，另一边的科技巨头已经下了重注。

2026 年 4 月 24 日，谷歌宣布将向 Anthropic 投资高达 400 亿美元。首批 100 亿美元现金以 3500 亿美元的估值注入，后续还将追加 300 亿美元，前提是 Anthropic 达到业绩目标。在此之前，亚马逊刚刚向 Anthropic 追加了 50 亿美元投资，并签署了价值 1000 亿美元的长期云服务协议。

谷歌的操作尤其引人深思。谷歌自身拥有 Gemini，并且是全球排名前三的人工智能模型提供商。然而，它依然选择向 Anthropic 投入 400 亿美元。

这并非单纯的财务投资。这更像是在购买一份“保险单”——确保无论最终在编程 AI 赛道上谁能胜出，谷歌都将是赢家股东名单中的一员。这是一种“双向押注”的极致策略：一方面发展自己的模型，另一方面投资最强的竞争对手。谷歌并非不怕失败，而是它输不起。

这种确定性，不仅体现在独角兽公司的估值之中，更深刻地烙印在云服务提供商的财务报告里。

2026 年第一季度，三大云服务提供商的财报呈现出一场显著的分化。Google Cloud 以 63% 的增速位居榜首，而其未履行合同（Backlog）——高达 4620 亿美元——更是令人瞩目。Sundar Pichai 在财报电话会议上直言，当前的瓶颈不在于需求，而是供给能力不足。

微软 Azure 增速为 40%，年化 AI 收入达到 370 亿美元，拥有最完整的生态系统，但在此次增长势头中被谷歌的表现所超越。AWS 增速为 28%，规模依然是最大的（年化运行率约 1500 亿美元），但其增速在三者中是最低的——这或许是大体量公司转型所付出的代价。

三大云服务巨头的 CEO 在财报电话会议上不约而同地强调了同一件事：人工智能是推动云业务增长的核心驱动力。Sundar Pichai、Satya Nadella 和 Andy Jassy 这三位平时在任何细节上都力争压倒对手的领导者，却在 AI 驱动增长这一点上达成了罕见的共识——这其中的含义不言而喻。

根据 Exponential View 的分析，人工智能收入在 Google Cloud 的占比已接近 23%，Azure 约占 10%（其中大部分来自 OpenAI），AWS 约占 5%。需要注意的是，这些数据是 2026 年初的，按照人工智能的增长速度，目前的比例只会更高。

回顾 2025 年，当时的市场气氛远没有现在这般乐观。

在那一年，“AI 泡沫论”是科技界最流行的讨论话题。《金融时报》发表了超过百篇带有“AI bubble”关键词的文章。电影《大空头》的原型人物 Michael Burry 公开做空英伟达和 Palantir，并预言“几乎所有的 AI 公司都将破产，大量的 AI 支出将被冲销”。高盛发出警告，称 AI 正在形成一个“封闭的资金循环”——科技公司之间相互投资，资金在几家巨头间流转，但终端客户的实际付费并未跟上。

泡沫论的核心逻辑其实非常简单：资本支出（CAPEX）正在急剧增长，但实际收入并未同步提升。四大科技巨头（亚马逊、微软、谷歌、Meta）在 2026 年的合计资本支出预计将达到 6950 至 7250 亿美元，而当时可见的企业级 AI 付费，更多还停留在“聊天机器人”的层面。

那时候人们最常问的问题是：投入了数千亿美元购买 GPU，除了写几首蹩脚的诗和生成几张手指不协调的图片，AI 到底能带来多少回报？

坦白说，当时这个问题的答案是：“还不确定。”

但现在，答案已经揭晓。AI 编程以一种极其震撼的方式回应了泡沫论。

当 AI 能够直接接管软件开发这个价值万亿美元的市场，并迅速转化为企业级订阅收入时，“商业循环缺乏闭环”的质疑在真实的现金流面前显得有些苍白。Exponential View 的分析师 Azeem Azhar 在最新的评估中给出了一个清晰的判断：“泡沫论可以暂时告一段落了。AI 已从实验阶段转变为基础设施。”

他的分析框架显示，投资与收入之比（行业压力指数）已从 5 个月前的 6.1 倍下降到 4.7 倍。如果这一趋势得以维持，到 2026 年第二季度将降至 3 倍以下——届时意味着收入已经真正“承接”了此前投入的基础设施。

而且，受到 AI 编程改变的不仅仅是硅谷的创业者，还包括那些最保守的企业。美国银行——这家拥有 120 年历史的老牌银行——报告称 AI 编程工具将其开发时间缩短了 30%，相当于节省了 2000 名全职工程师的工作量。挪威管理着 2 万亿美元主权财富基金，通过使用 Claude 实现投资组合监控自动化，每年节省约 1700 万至 3200 万美元的人力成本。Meta 公司报告称，自 2025 年 1 月以来，工程产出提升了 30%，其中重度用户的使用效率提升了 80%。

Exponential View 的分析团队在深入分析了超过 6000 份标普 500 公司财报电话会议记录后，提取了近 3 万条与 AI 相关的信息。他们发现，能够在财报电话会议上提供 AI 应用量化数据的公司比例，已从 1.9% 飙升至 13.2%。其中大多数效率提升听起来并不“令人兴奋”——例如客服分流率的提高、开发时间的缩短、运营成本的降低。但正是这种“不起眼”的改进，才代表着真正的普及。

至此，一个更深层次的问题浮现出来：为什么 AI 首先在编程领域实现了规模化的商业成功，而不是在医疗、法律、金融，或者看似更简单的旅游规划领域？

前 OpenAI 联合创始人 Andrej Karpathy 提出的解释，可能是目前为止该行业最重要的见解之一。

他认为，AI 编程之所以能够率先实现商业化落地，关键在于两点。

第一，编程拥有“明确且可验证的奖励函数”（Reinforcement Learning with Verifiable Rewards，RLVR）。代码的质量好坏，不需要人类专家进行主观评价——只需直接运行，检查测试用例是否通过，结果是二元的：正确或错误。这一看似简单的特性，使得 AI 模型能够通过强化学习实现极其高效的自我进化。模型可以自行编写代码、运行、评估结果，并在“通过”与“未通过”的反馈中快速迭代。

这听起来简单，但它代表了 AI 训练领域的一场革命。传统的 AI 训练需要大量人工标注数据，而编程领域的“标注”是自动化的——编译器不会出错，测试不会说谎。

第二，B2B 价值极高。在企业环境中，编程效率的提升直接转化为经济效益——降低人力成本、缩短产品迭代周期、压缩 bug 修复时间。这种价值是可量化的、可预测的，因此企业愿意为此支付高昂的费用。Anthropic 的推理基础设施毛利率从一年前的 38% 跃升至超过 70%，这本身就说明了其商业模式的持续改善。

而 AI 编程之所以被形容为“暴力美学”，正是因为这种“可验证性”带来的独特工作方式：它知识渊博——几乎掌握所有编程语言、框架、库的使用方法；速度惊人——能在几十秒内完成一个完整的模块；但它也“有些笨拙”——在深层架构设计上，缺乏对系统长期演进的全局把握，有时会写出能够运行但设计不佳的代码。

然而，AI 不怕“笨”，它怕的是“不确定”。可验证的编程任务，恰恰是最确定的。

作为对比，看看 AI 在旅游规划上的表现，就能清晰地理解其中的差异。

CNBC 在 2026 年 3 月的一项调查描绘了一个令人沮丧的场景。一位旅客在巴黎出差，让 ChatGPT 规划前往会议地点的路线。AI 自信满满地提供了一条捷径——但它未能考虑到前方道路因施工而封闭的情况。原本只需 10 分钟的路程，却变成了长达 45 分钟的煎熬。

Savanti Travel 的旅行顾问 Leigh Rowan 一针见血地指出：“这些看起来像是极端个例，但实际上非常普遍。”

CNN 的一档节目也报道了类似的问题：AI 在旅游规划中会推荐不存在的餐厅、忽略季节性的天气变化、无法处理多代同堂家庭出行中行动不便的长辈的需求。

问题出在哪里？缺乏可验证的奖励函数。什么样的行程才是“完美”的？这是一个主观问题。道路是否封闭？地标是否真实存在？信息实时且碎片化。在规划阶段，你无法像运行一段代码那样即时验证其对错。

Klook 的调查数据显示了更直观的对比：91% 的全球旅行者在使用 AI 规划工具，但 Booking.com 的另一份报告显示，同样有 91% 的人对 AI 生成的结果表示担忧，只有 35% 的人完全信任它。

这就是差距所在。AI 编程的试错成本是短暂的计算时间；而 AI 旅游规划的试错成本则可能是一个被浪费的假期、一次错过的会议、或者是在巴黎街头焦头烂额的商务旅客。

编程为 AI 提供了一个完美的训练场和完美的商业场景，而旅游规划则为 AI 设置了一个充满陷阱的“不确定性沼泽”。这两种表现的对比，不仅仅是一个技术故事，更是一个关于“AI 能做什么和不能做什么”的深刻原理阐释。

回到行业格局。

目前，谷歌和 Anthropic 在 AI 编程的竞赛中暂时处于领先地位。Google Cloud 拥有强大的基础设施（4620 亿美元的 backlog 就是明证），而 Anthropic 则拥有最符合企业级需求的产品。两者的合作，正在蚕食 AWS 和 Azure 的新增市场份额。

但这种格局是否稳固？远非如此。

首先，开源模型的追赶速度令人惊叹。2026 年 4 月，小米 AI 负责人罗福莉带领团队推出的 MiMo-V2.5-Pro 模型，在编程基准测试中超越了 DeepSeek V4 Pro，并以 MIT 协议开源。发布首日，该模型已被七家国内芯片厂商集成。罗福莉在之前的深度访谈中曾指出一个关键趋势：在强化学习的范式下，模型之间的差距并非在拉大，而是在缩小。原因很简单：RL 本身就是一个“追赶型”的训练方法——只要存在足够好的奖励信号，后来者可以比先行者更快地实现突破。

其次，编程场景的特殊性决定了“顶尖模型”难以形成垄断。代码是高度敏感的。企业不太可能将核心代码库的全部权限交给任何一个第三方的云端 AI。本地部署、开源模型、自托管——这些需求将自然而然地促使市场形成多极化格局。微软、亚马逊以及国内的云服务厂商都不会轻易放弃这块市场。Cursor 等独立工具依然拥有庞大的用户群体，Anthropic 的领先优势可能会被市场结构本身的分散性所稀释。

更重要的是，模型能力的“天花板效应”已经若隐若现。罗福莉在张小珺的深度访谈中直言，强化学习的范式本身是一把双刃剑：它让所有人都能以更低的成本实现追赶，但也意味着单纯依赖预训练的 Scaling Law 已经达到了边际效益递减的阶段。未来的竞争将从“谁的模型更强大”转向“谁的落地能力更出色”，从比拼参数数量转向比拼工程实现能力。

一个时代正在被颠覆。

旧的软件开发模式是“人编写代码，机器执行”。未来的模式将是“人定义目标，AI 暴力执行”。程序员并非注定失业——他们的角色正在从“打字员”转变为“问题定义者”。

这场重构涉及的是一个万亿美元级别的市场。Google Cloud 的 4620 亿美元 backlog 只是一个侧面，它背后是整个软件行业正在被 AI 重新定价的现实。

Anthropic 的 440 亿美元 ARR、马斯克的算力帝国、谷歌的 400 亿美元投资、Karpathy 提出的“可验证奖励函数”理论，以及巴黎街头那位被 ChatGPT 带错路的商务旅客——所有这些零散的片段汇聚在一起，讲述的都是同一个故事：AI 的商业化并非泛泛地“赋能一切”，而是在那些具备确定性反馈的领域，以一种近乎“暴力美学”的方式逐一攻破。

AI 的确定性就在于此：它并非无所不能，而是在那些它能够胜任的领域，其表现之出色足以令人瞠目结舌。

在下一篇文章中，我们将继续探讨其他“确定性领域”的突破——以及那些暂时还未看到突破的领域，为何会停滞不前。

← 上一篇：AI时代：普通人如何抓住机遇？AI的答案与行动的距离下一篇：保险业智能化转型实战解析 →