盲目信赖AI反易出错，保持质疑方能善用

发布时间：2026-06-04 20:21阅读：13

讲一件或许会让你感到不适的事实。

假如你是一位对AI满怀热忱的拥护者——认为AI强大、精准且实用，习惯性地采纳AI提供的建议——

那么这项研究的结论，恐怕并不那么讨喜。

来自慕尼黑大学统计系的研究团队，召集了2784名受试者，开展了一项看似枯燥却结论惊人的实验。

他们发现：在人机协作的任务中，对AI持有怀疑态度的人，表现明显优于盲目信任AI的人。

这种优势并非微乎其微，而是在错误识别率和任务准确率上，呈现出系统性的、显著的领先。

研究人员让这2784名参与者完成一项真实的工作任务：从企业年度报告中，提取温室气体排放数据。

这是一项需要仔细阅读、判断及核对的任务——AI可以辅助，但数据的准确性，最终仍需人来确认。

参与者被随机分组，研究者在三个维度上进行了对照实验：

第一个维度：AI建议的质量——有时AI提供正确答案，有时故意提供错误答案，观察参与者能否识别。

第二个维度：任务负担——部分小组需对AI标记的错误进行说明，另一部分则无需说明。

第三个维度：金钱激励——部分小组表现优异会有奖励，另一部分则没有。

在整个过程中，研究者持续收集每位参与者的行为数据：他们采纳了多少AI建议，纠正了多少，漏掉了多少错误，以及他们在实验前对AI的态度评分。

按常理推断，若要求参与者对每一次纠正做出解释，理应让他们更加仔细——毕竟要“说明白原因”，就需要深入思考。

结果却完全相反。

当研究者要求参与者为纠错行为提供理由时，参与者反而减少了纠错，更倾向于直接接受AI的建议——包括那些显而易见的错误答案。

原因在于认知负担。

当“纠错”这一动作变得复杂（不仅要改答案，还要解释理由），大脑会启动节能策略：既然纠错如此麻烦，那就直接接受AI的答案吧。

研究者将这一机制称为“认知捷径”——大脑在面对复杂要求时，会自动寻找阻力最小的路径，而那条路径，往往是无条件地相信AI。

这一发现对许多公司的AI审核流程，有着直接的警示意义：如果你的审核流程设计得过于繁琐，员工不会更认真地检查AI，他们只会更懒惰地接受AI的答案。

比第一个发现更重要的，是研究者在分析个体差异时观察到的结果。

他们将所有参与者依据对AI的态度分为两组：

信任AI的人：认为AI普遍可靠，倾向于接受AI建议，对自动化持正面看法。

怀疑AI的人：对AI持保留态度，习惯性地质疑AI的输出，倾向于用自己的判断去核查AI。

随后，研究者比较了两组人在此项任务中的表现。

结论十分清晰：

怀疑AI的人，检测错误的成功率更高，任务总体准确率也更高。

信任AI的人，展现了研究者所说的“危险的过度依赖”——他们更频繁地接受了AI给出的错误答案，却未意识到问题所在。

更令研究者意外的是：这一差异比年龄、学历、工作经验、技术背景等因素都更为关键。

一个对AI持怀疑态度的普通人，在与人机协作的任务上，表现甚至能超过一位高度信任AI的专业人士。

研究中还有一个细节，值得单独提及。

研究者测试了金钱激励的效果——给部分参与者明确的奖励：表现越好，报酬越高。

直觉告诉我们：有金钱驱动，人们会更认真，检查得更仔细。

数据表明：金钱激励对任务表现没有一致的显著影响。

加薪无法让一个过度信任AI的人变得更具批判性。

这一发现对职场有一个非常实际的启示：如果一家公司的AI审核流程主要依靠“绩效激励”来保障质量，这套机制可能比它看起来脆弱得多。

这一结论背后有一个心理学解释。

当你对AI持怀疑态度，你与AI的协作方式是这样的：

AI给出一个建议，你将其视为需要核实的参考，而非可直接使用的答案。你会花时间对照原始材料检查，你会留意那些“似乎不对劲”的地方，你会在接受前多思考一步。

这“多思考一步”，正是错误被发现的关键时刻。

信任AI的人，跳过了这一步。AI给出答案，感觉正确，接受，继续下一个。在绝大多数情况下，这个流程运转顺畅——因为AI大多数时候是正确的。

但正是因为大多数时候都对，当AI偶尔出错时，那个错误更容易被忽略过去。

研究者将这一机制称为“自动化偏见”（Automation Bias）——我们对自动化系统产生了一种习惯性的信任，这种信任在日常使用中不断被强化，但在AI犯错的关键时刻，却成了我们的盲点。

研究者在论文中指出，这一发现“超越了任何单一的应用场景”。

他们的意思是：这一心理机制，在任何人机协作的场景中都在起作用。

你让AI帮你写一封重要的邮件，然后直接发送——你检查了吗？

你让AI帮你分析一份数据，然后把结论汇报给上司——你自己核对了吗？

你让AI帮你做了一个决定，因为AI给出了一段流畅自信的理由——你有没有想过，那段理由可能是错的？

信任AI，并不是一种美德，也不是一种能力。

在这项研究中，它是一种风险因素。

这篇文章并非在说“不要用AI”，也不是在说“AI不可信”。

研究者在论文最后阐述得很清楚：

“成功的人机协作，不只取决于算法的性能，还取决于谁在审查AI的输出，以及工作流程是如何设计的。”

怀疑AI的人做对的，并非拒绝使用AI，而是在使用AI的同时，保留了自己的判断。

AI是工具，工具有失手的时候。

一个好的木匠，不会因为锤子通常很好用，就不看自己在钉哪里。

原论文：Jacob Beck, Stephanie Eckman, Christoph Kern, Frauke Kreuter（慕尼黑大学统计系 + 慕尼黑机器学习中心 + 马里兰大学），《Bias in the Loop: How Humans Evaluate AI-Generated Suggestions》，arXiv:2509.08514，2025年9月，后收录于Harvard Data Science Review，2026年春季刊

原文链接：https://arxiv.org/abs/2509.08514

← 上一篇：一季度折叠屏战报：荣耀份额倍增稳居第二下一篇：日系自动驾驶巴士实测：中国车企占据半成，比亚迪领跑 →