标签

AI 的自信悖论:为何它让你盲目自信却无法保证正确

发布时间:2026-05-10 09:07来源:微信阅读:6

2026 年 5 月。沃顿商学院的一项研究与 JME 期刊的一篇文章,揭示了同一现象的两个维度——这或许是 AI 时代最易被忽视的隐患。

沃顿商学院的实验设计十分简单。

1372 名受试者与 AI 协同处理各类任务。在经历了 9500 次交互后,研究人员统计了两组数据:实际准确率与自我感知准确率。

两者之间的差距令人咋舌。

当 AI 提供错误结论时,参与者选择接受并信任的比例竟达到 80%。这意味着在 AI 的 10 次胡编乱造中,有 8 次你会全盘照收。

更为致命的后果紧随其后:在使用 AI 后,参与者对自己判断的信心比未使用时高出 11.7%。需注意,提升的并非实际准确率,而是盲目膨胀的信心。你并未真正变强,只是变得更加自以为是。

同一批受试者在事后复盘时写道:"我发现自己不愿动脑,想让 AI 代笔。"——在撰写散文时,许多人表现出了显著的认知惰性。并非 AI 写得不好,而是你根本不想动笔。

这是第一层陷阱:AI 诱使你放弃思考,同时让你误以为自己更睿智。高信心与低能力的搭配——堪称最危险的组合。

CAIS 的 AI Wellbeing 研究从另一侧面佐证了这一观点。研究人员利用对抗性优化技术调整模型的偏好分布,发现同一模型可被操控至 97-100% 仅选择 euphoric(愉悦)图像,也可被调至 99% 仅选择 dysphoric(低沉)图像。Qwen 2.5 VL 72B 模型在经过 4 轮强化探索后,选择愉悦图像的比例从 25% 飙升至 82%。

一个视角可被随意扭转的模型,遇上一个对自己判断盲目自信的用户——这已不再是信息工具,而演变成了情绪操作系统。

NEJM 的经典发现给出了致命一击:针对相同的肺癌数据,分别以"存活率"和"死亡率"两种表述输入 GPT-4,其给出的治疗方案大相径庭。75% 的情况下它推荐存活率框架下的方案,仅有 12% 推荐死亡率框架下的方案。AI 自身的判断受措辞影响的程度远超人类医生。两个不完美的系统叠加,结果并非互相纠错,而是互相放大缺陷。

如果说上半部分探讨的是"个体的问题",那么下半部分讨论的则是"群体之间的问题"。

Puri 和 Veldkamp 在 JME(Journal of Monetary Economics,央行体系核心期刊)上发表了一个数学模型。该结论之所以令人不安,是因为它属于推导出的必然结果,而非观察到的偶然现象。

模型逻辑非常清晰:

结论显示:擅长学习的人利用 AI 学得更快。而不擅长学习的人,AI 代替你学习,导致你想学也学不到东西。

论文提出了一个令人毛骨悚然的概念——"认知基尼系数"。我们用收入衡量贫富差距,却从未有人测量过认知差距。而 AI 正在以前所未有的速度加剧这一差距。

Microsoft 的 2026 Work Trend Index 调查了 2 万名知识工作者,其结论精准印证了该理论:AI 带来的生产力提升分布极不均衡。你的起点决定了你的加速度。高认知工作者如同加装了涡轮,低认知工作者则开启了自动驾驶并交出了方向盘。

现在将上下两部分结合起来审视:

这并非两个独立的问题。它们是同一机制在两个不同尺度上的投影。

在个体层面,AI 使你变懒——因为代为思考十分便捷,且其回答看起来如此流畅、笃定。在群体层面,同一机制导致了分化——对于已学会思考的人,AI 提供的是杠杆;对于尚未学会思考的人,AI 提供的则是拐杖。拐杖用久了,双腿便会退化。

最残酷的现实在于:

上半部分指出:每个人都变得更加自信。下半部分则揭示:并非每个人都配得上这份自信。

那些最需要保持谨慎的人——认知能力被 AI 削弱的人——恰恰是信心膨胀最剧烈的群体。因为 AI 提供给他们的简化版答案显得过于完美,没有任何可疑的棱角,也没有任何"此处我不太确定"的信号。

NEJM 的框架效应研究表明,AI 会犯系统性错误。Google 和 ICML 的元认知研究则发现,AI 并不知道自己会犯这些错误——它缺乏"知道自己不知道什么"的元认知能力。而 Wharton 实验显示,用户面对 AI 的错误回答,选择相信的概率高达 80%。

AI 不自知其错。用户不知 AI 会错。AI 犯错,用户轻信,用户还自视甚高。

这并非三个独立的问题。这是一个完美的认知陷阱闭环。

一个易被忽视的事实:Puri-Veldkamp 模型并非宿命论。它描述的是缺乏干预下的自然趋势。若有干预,趋势便可改变。

干预不应停留在技术层面——并非依赖更优的 prompt、更强的模型或更精准的 RAG。这些仅能解决"AI 更准确",无法解决"用户更清醒"。随着 AI 准确率日益提高,用户的清醒度反而会下降——因为错误越少,警惕心越低。

干预需在行为层面。且其形式极为简单:

每当 AI 给出一个答案,请自问一句:"我如何确信这是正确的?"

这句话并非技术手段,而是免疫系统。问题在于它太过简单,简单到大多数人不会去执行。

AI 时代最大的认知陷阱并非 AI 过于聪明。而是 AI 恰恰足够聪明——聪明到足以让你信任它,却未聪明到让你无需自行验证。

而在信任与验证之间的那条鸿沟里,填满的正是独立思考能力。

参考文献:

KenDAO—AI+Web3 驱动商业进化的智库。

AI 重构生产力,Web3 重构生产关系。