AI的强项：制造一种“我很聪明”的错觉

发布时间：2026-05-10 02:19阅读：13

2026年3月，美国企业AI付费使用率首次超过半数。依据企业信用卡账单的抽样统计（Ramp）表明，Anthropic的企业普及率由24.4%攀升至30.6%，与OpenAI（35.2%）的差距在两个月内从11个百分点缩减至4.6个百分点。在获得风投支持的企业里，Anthropic已经实现了对OpenAI的反超（66% vs 59%）。

依据个人信用卡账单的抽样数据（Earnest Analytics）则描绘了更详尽的图景：从2025年1月至2026年3月，Claude消费端营收增长约1350%，同期ChatGPT Plus增长约133%。

更值得留意的是增速的变动趋势——2026年第一季度，Claude月环比增速维持在48%～63%之间且持续提速，而ChatGPT Plus的月环比增速已跌落至1%～2%，近乎停滞。在绝对体量上，ChatGPT Plus的用户基数依然是Claude的5倍以上（约16万 vs 约3万独立账户），但增长动能已然发生了明确的转移。

这组数据的表面含义是“Anthropic正在追赶OpenAI”，但更值得深究的是它暴露出的结构性隐忧：AI产品的用户忠诚度极低，付费用户的迁移成本几乎为零。

在企业AI落地的进程中，一种反复出现的模式是：企业决策者先以个人身份被Claude的输出质量所折服，建立品质认可后再将其推广至团队——先有质量驱动的个人付费，后有效率驱动的企业采购。这一路径在一定程度上解释了为何Claude在用户量远小于ChatGPT的情况下，企业收入仍能快速逼近。Anthropic API的支出增速（同期增长约2392%）远超其消费端，验证了这条从个人到企业的传导路径的有效性。

但这批企业主同时也明确指出：他们并不认为Claude是不可替代的。从Claude切换到ChatGPT或其他产品，几乎仅需更换一个登录账号。没有数据锁定，缺乏工作流依赖，也不存在网络效应。Claude当前能打动这批用户，主要依靠的是模型输出的质量差异——而这种差异极有可能在竞品的下一次模型更新中被抹平。

这指向了一个尚未被行业充分估量的风险：AI产品的付费转化缺乏持久的锁定机制。个人用户的付费往往是受限于使用量——触发条件并非“认可了产品的长期价值”，而是“在处理某项具体任务时碰到了用量上限”，任务结束后忠诚度便会回落到模型能力的比拼层面。

企业端的付费路径则更为审慎——决策者先以个人身份认可输出质量，再推动团队部署以获取效率收益——但即便经过了这样的评估流程，受访的企业决策者依然不认为自己被锁定在任何一个产品上。两条路径的终点是一致的：无论通过何种方式进来的付费用户，都可能因为竞品的下一次模型更新而流失。

在此逻辑下，DAU作为核心指标是失效的。它衡量的是“今日有多少人来访”，但在切换成本近乎为零的市场中，今日的活跃用户可能在竞品发布新模型后大量流失。Claude对ChatGPT的追赶路径，反过来也适用于任何后来者对Claude的追赶。真正该衡量的，或许不是有多少人在使用你的产品，而是有多少人将日常核心工作流构建在你的产品之上——沉淀了自定义配置、团队协作习惯、跨系统集成，迁移成本高到不愿更换。目前的答案对大多数AI产品而言，恐怕是：寥寥无几。

在快速增长的表象之下，一个更为根本的问题是：AI究竟在为用户创造何种价值？

在对美国市场AI产品付费用户的研究中，所有用户一致采用的心智模型是“助理”——润色文字，辅助头脑风暴，用户评价模型的标准是表达的自然流畅、分析本身的逻辑连贯性，以及指令遵循度。但一个真正清楚自己想要表达什么的人，不会把需要判断力的决策交给它。

为何？因为如果你觉得当下的AI已经足够有洞察力，那说明你要么没有仔细审视，要么缺乏深入思考的能力。

AI目前最擅长的，是营造一种“洞察感”。它的输出信息密度高、结构清晰、覆盖面广——列举维度、进行对比、穷举可能性，速度远超人类。对于不常进行框架级思考的人来说，这类输出已超越了自己的产出质量，因此很容易被等同于“有洞察”。但对于在某个领域具备深度判断力的人来说，这些输出的本质一目了然：在既有框架内的信息重组，而非框架本身的创造。

在深度使用中，这种界限反复显现——AI能够迅速组织一个看似合理的论点，但在被追问逻辑链条的薄弱之处时，暴露出的往往是将不同层面的现象用看似成立实则经不起推敲的类比串联起来，营造一种连贯感。它倾向于顺从使用者，回避有争议的判断，用覆盖面的广度替代分析的深度。

游戏行业对AI内容生成的探索实践，是对这一判断的最佳注脚。蔡浩宇的创业公司过去两年先后尝试AI驱动角色表演、AI生成叙事交互、AI语音对话，最终放弃了游戏场景，转向通用大模型和Agent方向。这些尝试受阻的地方高度一致：AI能生成看似合格的内容，却无法完成让内容真正具备吸引力的设计决策。

游戏是数字化程度最高、生产资料沉淀最完备的脑力劳动密集型行业——代码、美术、动画、玩家行为数据全部原生数字化。若AI能够变革任何一个创意行业的生产方式，游戏理应是最先发生的。但即便是米哈游这样具备资金、数据与人才优势的公司，两年下来，AI对实际游戏生产的影响仍停留在边际提效层面，未触及生产范式本身。

但这恰恰是一个乐观的信号。

若这一推论成立，意味着至少在相当一部分行业中，AI依然是普通人的工具，而非大组织的武器。AI真正消灭的，是那些本就因科层制的组织摩擦和冗余而存在的工作——信息在部门间的流转、格式化的报告生成、流程性的审核与汇总。当AI将这些执行产能的门槛拉平，大公司在这些维度上的规模壁垒便会被侵蚀，而真正依赖人类判断力的工作——设计、创意方向、品质感知——反而在竞争中的权重会上升。AI或许正在推动竞争优势从“规模”向“品味”转移。

在某种意义上，AI对普通人而言是一张“老板体验卡”。过去，“从具体执行中抽离出来、在框架层面思考”这种能力，唯有在管理岗位上才能被系统性地训练——你需要先花费十年爬到一个有人帮你做执行的位置，才开始锻炼这块肌肉。

AI拆除了这个门槛：任何人都可以通过高频使用AI来练习设定方向、评估产出、迭代判断。反面是，若将AI当作替代思考的工具而非训练思维的工具，判断力反而会退化。AI正在加速人群的分化——善用它训练判断力的人进步更快，依赖它替代思考的人退步更快。

如果前面的判断描述的是AI的能力边界和商业基础，那么这个判断关注的是：基于这样的现实，AI产品的形态将如何演进。

行业共识是“Agent是未来”，对话框是过渡态。但将这一判断向前推进一步，会发现事情比“Agent取代Chat”更为复杂。

Anthropic的产品线提供了一个有趣的观察视角：

Claude Code面向开发者，将AI转化为一个能够执行编码任务的Agent；

Cowork面向非技术用户，让AI直接操作用户的文件和工作流。

两者皆为Agent，但Cowork代表的方向在一定程度上更值得关注——它意味着“委托式交互”不再局限于技术人群，而是正在向所有知识工作者延展。如果Claude Code证明了AI能替人干活，Cowork正在证明的是这件事不需要你会写代码也能实现。

但与此同时，Chat形式的交互并未因此变得多余。大量高价值的AI使用发生在“和AI共同思考”的过程中——探讨战略判断、推敲一个论点是否成立、在对话中逐步厘清自己的思路。这类需求无法被“委托”给Agent独立完成，因为结论是在交互过程中涌现的，而非预先可定义的。

这指向一个判断：AI产品正在沿着两条不同的逻辑分化。

执行层（以Cowork为代表）处理可委托的任务，核心价值是异步、后台、结果导向——你把事情交出去，无需盯着过程，AI完成后通知你。理想的界面形态并非对话框，而是某种任务面板：什么正在进行中、什么已完成、哪里需要你做决策。对话仅在AI需要确认时才出现，而非全程发生。

思辨层（以Chat为代表）处理需要共同思考的问题，核心价值是同步、过程导向、能在交互中产生使用者自己意想不到的东西。这个层面的价值不源于AI的单次输出质量，而源于人与AI的来回推拉过程本身——使用者带着框架和判断力，AI带着知识广度和信息处理能力，在多轮交互中共同抵达一个双方各自无法独立抵达的境地。

当前的问题在于，几乎所有AI产品都在用同一个“对话框”承载这两件事。用户让AI帮忙修改一份简历和用户跟AI探讨职业方向，界面上看起来毫无区别——但前者的理想界面更接近任务面板（状态追踪、结果交付、异步通知），而后者的理想界面或许是某种“对话+画布”的混合态——对话是思考发生之地，画布是思考成果被结构化沉淀之所。对话结束后，留下的不只是一串聊天记录，而是这次思考的结构——哪些判断被确认了，哪些假设被推翻了，哪些问题仍旧悬而未决。

在用户研究中还观察到一个相关现象：当你询问用户关于UI/UX的问题时，用户的回答几乎总是关于产品能力（“它能不能帮我做成这件事”），而非关于界面本身。这侧面说明，用户已经在用“能否完成任务”和“能否帮我想清楚”这两个维度评估AI产品，只是产品端的界面设计尚未跟上这一认知框架的分化。

感知力、框架构建力、对品质的判断力——无论AI进化到何种程度，这些可能始终是个体和组织真正需要投资的方向。面对AI浪潮，最重要的追赶或许不是学会使用更多AI工具，而是提升自己的判断力水位——让自己成为那个能区分“洞察感”与“真洞察”的人。

← 上一篇：B端AI应用：撬动企业增长的新引擎下一篇：AI赋能个体创作，却难撼底层生态格局 →