AI使用越多,能力越弱?Anthropic研究揭示真相
AI用得越多,能力越弱?Anthropic的这项研究让我感到不安。2026年2月,Anthropic的研究员Judy Shen和Alex Tamkin发布了一篇论文(arXiv: 2601.20245),专门探讨了AI辅助对技能形成的影响。Anthropic是开发Claude的公司——这意味着这是AI行业顶尖企业之一,正在深入研究“使用AI是否会使人退化”。实验设计严谨,采用随机对照实验:• 让一批开发者学习一个从未接触过的Python异步库 • 模拟实际工作环境:边做任务边学新技能 • 测量两项指标:完成速度及后续技能水平(概念理解、代码阅读、调试能力)。结果令人震惊:• 使用AI辅助的组,技能评估低了17%(统计上显著,Cohen's d = 0.74) • 完成速度呢?两组没有明显差异。也就是说,AI既没让你更快,也没让你学到更多。更讽刺的是,有些参与者为了“用好AI”,花费超过30%的任务时间在编写prompt上,有人前后问了15个问题。研究团队并未止步于“AI有害”的结论。他们查看了所有参与者的屏幕录像,将AI使用方式归纳为6种模式,并发现了真正的分水岭。🚫 三种导致退化的使用方式 1. AI全包(得分24%) 让AI直接写代码,自己复制粘贴,任务完成了,但大脑未参与。这是最常见的“高效”错觉——看起来速度快,但实际上什么都没留下。 2. 渐进依赖(得分39%) 开始时还在独立思考,遇到困难立刻求助AI。问题是,困难正是学习发生的地方。跳过挣扎,也跳过了理解。 3. 要代码+要解释,但不消化(得分35%) 看起来很认真,让AI写完还让它解释一遍。但解释只是过眼云烟,没有真正用脑子重建逻辑。这种模式最有迷惑性——感觉在学习,实际上只是走过场。✅ 三种提升能力的使用方式 1. 先生成,后理解(得分86%) 让AI写出代码,然后逐行阅读,问自己:这行是什么意思?为什么这样写?能否修改?AI是起点,理解是终点。 2. 只问概念,不要答案(得分68%) 不问“帮我写这段代码”,而是问“这个异步机制的原理是什么?” 自己动手写,AI负责解惑,不负责代劳。 3. 迭代调试(得分65%) 自己先想方向、动手尝试,出现错误后用AI帮助分析和纠错。主动权在自己手中,AI是放大器,不是替代品。关键变量只有一个 看完这六种模式,规律很明显: 分数高的三种,都要求你的大脑一直在运转。 分数低的三种,都在某个环节把思考外包出去了。研究的核心结论只有一句话: AI增强的生产力并不是通往能力的捷径。回到我那个三秒的停顿 我明白了:不确定,是因为我用的是“全包”模式——让AI做,我在旁边看着。 任务完成了,系统跑通了,但理解是碎片化的。如果某个环节出现问题,我不确定能定位到哪层。这不是AI的错。是我使用的方式有问题。一个值得每天自问的问题 今天用AI完成的事情,明天没有AI,还能做吗? 如果答案是“能”,你在用AI放大自己。 如果答案是“不确定”,你在用AI替代自己。两者都在发生,区别在于你是否意识到,并做出刻意选择。参考:Shen & Tamkin, “How AI Impacts Skill Formation”, arXiv:2601.20245v2, Feb 2026, Anthropic. 诺贝松AI成长社区 个人观点,仅供参考
2026年2月,Anthropic的研究员Judy Shen和Alex Tamkin发布了一篇论文(arXiv: 2601.20245),专门研究AI辅助对技能形成的影响。
Anthropic是开发Claude的公司——这意味着这是AI行业顶尖企业之一,正在深入研究“使用AI是否会使人退化”。
实验设计严谨,采用随机对照实验:
• 让一批开发者学习一个从未接触过的Python异步库
• 模拟实际工作环境:边做任务边学新技能
• 测量两项指标:完成速度及后续技能水平(概念理解、代码阅读、调试能力)
结果令人震惊:
• 使用AI辅助的组,技能评估低了17%(统计上显著,Cohen's d = 0.74)
• 完成速度呢?两组没有明显差异
也就是说,AI既没让你更快,也没让你学到更多。
更讽刺的是,有些参与者为了“用好AI”,花费超过30%的任务时间在编写prompt上,有人前后问了15个问题。
研究团队并未止步于“AI有害”的结论。他们查看了所有参与者的屏幕录像,将AI使用方式归纳为6种模式,并发现了真正的分水岭。
让AI直接写代码,自己复制粘贴,任务完成了,但大脑未参与。
这是最常见的“高效”错觉——看起来速度快,但实际上什么都没留下。
开始时还在独立思考,遇到困难立刻求助AI。
问题是,困难正是学习发生的地方。跳过挣扎,也跳过了理解。
看起来很认真,让AI写完还让它解释一遍。但解释只是过眼云烟,没有真正用脑子重建逻辑。
这种模式最有迷惑性——感觉在学习,实际上只是走过场。
让AI写出代码,然后逐行阅读,问自己:这行是什么意思?为什么这样写?能否修改?
AI是起点,理解是终点。
不问“帮我写这段代码”,而是问“这个异步机制的原理是什么?”
自己动手写,AI负责解惑,不负责代劳。
自己先想方向、动手尝试,出现错误后用AI帮助分析和纠错。
主动权在自己手中,AI是放大器,不是替代品。
看完这六种模式,规律很明显:
分数低的三种,都在某个环节把思考外包出去了。
研究的核心结论只有一句话:
我明白了:不确定,是因为我用的是“全包”模式——让AI做,我在旁边看着。
任务完成了,系统跑通了,但理解是碎片化的。如果某个环节出现问题,我不确定能定位到哪层。
这不是AI的错。是我使用的方式有问题。
如果答案是“能”,你在用AI放大自己。
如果答案是“不确定”,你在用AI替代自己。
两者都在发生,区别在于你是否意识到,并做出刻意选择。
诺贝松AI成长社区 个人观点,仅供参考