AI使用越多，能力越弱？Anthropic研究揭示真相

发布时间：2026-03-30 07:32阅读：12

AI用得越多，能力越弱？Anthropic的这项研究让我感到不安。2026年2月，Anthropic的研究员Judy Shen和Alex Tamkin发布了一篇论文（arXiv: 2601.20245），专门探讨了AI辅助对技能形成的影响。Anthropic是开发Claude的公司——这意味着这是AI行业顶尖企业之一，正在深入研究“使用AI是否会使人退化”。实验设计严谨，采用随机对照实验：• 让一批开发者学习一个从未接触过的Python异步库 • 模拟实际工作环境：边做任务边学新技能 • 测量两项指标：完成速度及后续技能水平（概念理解、代码阅读、调试能力）。结果令人震惊：• 使用AI辅助的组，技能评估低了17%（统计上显著，Cohen's d = 0.74） • 完成速度呢？两组没有明显差异。也就是说，AI既没让你更快，也没让你学到更多。更讽刺的是，有些参与者为了“用好AI”，花费超过30%的任务时间在编写prompt上，有人前后问了15个问题。研究团队并未止步于“AI有害”的结论。他们查看了所有参与者的屏幕录像，将AI使用方式归纳为6种模式，并发现了真正的分水岭。🚫 三种导致退化的使用方式 1. AI全包（得分24%）让AI直接写代码，自己复制粘贴，任务完成了，但大脑未参与。这是最常见的“高效”错觉——看起来速度快，但实际上什么都没留下。 2. 渐进依赖（得分39%）开始时还在独立思考，遇到困难立刻求助AI。问题是，困难正是学习发生的地方。跳过挣扎，也跳过了理解。 3. 要代码+要解释，但不消化（得分35%）看起来很认真，让AI写完还让它解释一遍。但解释只是过眼云烟，没有真正用脑子重建逻辑。这种模式最有迷惑性——感觉在学习，实际上只是走过场。✅ 三种提升能力的使用方式 1. 先生成，后理解（得分86%）让AI写出代码，然后逐行阅读，问自己：这行是什么意思？为什么这样写？能否修改？AI是起点，理解是终点。 2. 只问概念，不要答案（得分68%）不问“帮我写这段代码”，而是问“这个异步机制的原理是什么？” 自己动手写，AI负责解惑，不负责代劳。 3. 迭代调试（得分65%）自己先想方向、动手尝试，出现错误后用AI帮助分析和纠错。主动权在自己手中，AI是放大器，不是替代品。关键变量只有一个看完这六种模式，规律很明显：分数高的三种，都要求你的大脑一直在运转。分数低的三种，都在某个环节把思考外包出去了。研究的核心结论只有一句话： AI增强的生产力并不是通往能力的捷径。回到我那个三秒的停顿我明白了：不确定，是因为我用的是“全包”模式——让AI做，我在旁边看着。任务完成了，系统跑通了，但理解是碎片化的。如果某个环节出现问题，我不确定能定位到哪层。这不是AI的错。是我使用的方式有问题。一个值得每天自问的问题今天用AI完成的事情，明天没有AI，还能做吗？如果答案是“能”，你在用AI放大自己。如果答案是“不确定”，你在用AI替代自己。两者都在发生，区别在于你是否意识到，并做出刻意选择。参考：Shen & Tamkin, “How AI Impacts Skill Formation”, arXiv:2601.20245v2, Feb 2026, Anthropic. 诺贝松AI成长社区个人观点，仅供参考

2026年2月，Anthropic的研究员Judy Shen和Alex Tamkin发布了一篇论文（arXiv: 2601.20245），专门研究AI辅助对技能形成的影响。

Anthropic是开发Claude的公司——这意味着这是AI行业顶尖企业之一，正在深入研究“使用AI是否会使人退化”。

实验设计严谨，采用随机对照实验：

• 让一批开发者学习一个从未接触过的Python异步库

• 模拟实际工作环境：边做任务边学新技能

• 测量两项指标：完成速度及后续技能水平（概念理解、代码阅读、调试能力）

结果令人震惊：

• 使用AI辅助的组，技能评估低了17%（统计上显著，Cohen's d = 0.74）

• 完成速度呢？两组没有明显差异

也就是说，AI既没让你更快，也没让你学到更多。

更讽刺的是，有些参与者为了“用好AI”，花费超过30%的任务时间在编写prompt上，有人前后问了15个问题。

研究团队并未止步于“AI有害”的结论。他们查看了所有参与者的屏幕录像，将AI使用方式归纳为6种模式，并发现了真正的分水岭。

让AI直接写代码，自己复制粘贴，任务完成了，但大脑未参与。

这是最常见的“高效”错觉——看起来速度快，但实际上什么都没留下。

开始时还在独立思考，遇到困难立刻求助AI。

问题是，困难正是学习发生的地方。跳过挣扎，也跳过了理解。

看起来很认真，让AI写完还让它解释一遍。但解释只是过眼云烟，没有真正用脑子重建逻辑。

这种模式最有迷惑性——感觉在学习，实际上只是走过场。

让AI写出代码，然后逐行阅读，问自己：这行是什么意思？为什么这样写？能否修改？

AI是起点，理解是终点。

不问“帮我写这段代码”，而是问“这个异步机制的原理是什么？”

自己动手写，AI负责解惑，不负责代劳。

自己先想方向、动手尝试，出现错误后用AI帮助分析和纠错。

主动权在自己手中，AI是放大器，不是替代品。

看完这六种模式，规律很明显：

分数低的三种，都在某个环节把思考外包出去了。

研究的核心结论只有一句话：

我明白了：不确定，是因为我用的是“全包”模式——让AI做，我在旁边看着。

任务完成了，系统跑通了，但理解是碎片化的。如果某个环节出现问题，我不确定能定位到哪层。

这不是AI的错。是我使用的方式有问题。

如果答案是“能”，你在用AI放大自己。

如果答案是“不确定”，你在用AI替代自己。

两者都在发生，区别在于你是否意识到，并做出刻意选择。

诺贝松AI成长社区个人观点，仅供参考

← 上一篇：AI幻觉：AI胡说八道的真相下一篇：AI智能体如何重塑外贸精准获客？ →