盲目信赖AI反易出错,保持质疑方能善用
讲一件或许会让你感到不适的事实。
假如你是一位对AI满怀热忱的拥护者——认为AI强大、精准且实用,习惯性地采纳AI提供的建议——
那么这项研究的结论,恐怕并不那么讨喜。
来自慕尼黑大学统计系的研究团队,召集了2784名受试者,开展了一项看似枯燥却结论惊人的实验。
他们发现:在人机协作的任务中,对AI持有怀疑态度的人,表现明显优于盲目信任AI的人。
这种优势并非微乎其微,而是在错误识别率和任务准确率上,呈现出系统性的、显著的领先。
研究人员让这2784名参与者完成一项真实的工作任务:从企业年度报告中,提取温室气体排放数据。
这是一项需要仔细阅读、判断及核对的任务——AI可以辅助,但数据的准确性,最终仍需人来确认。
参与者被随机分组,研究者在三个维度上进行了对照实验:
第一个维度:AI建议的质量——有时AI提供正确答案,有时故意提供错误答案,观察参与者能否识别。
第二个维度:任务负担——部分小组需对AI标记的错误进行说明,另一部分则无需说明。
第三个维度:金钱激励——部分小组表现优异会有奖励,另一部分则没有。
在整个过程中,研究者持续收集每位参与者的行为数据:他们采纳了多少AI建议,纠正了多少,漏掉了多少错误,以及他们在实验前对AI的态度评分。
按常理推断,若要求参与者对每一次纠正做出解释,理应让他们更加仔细——毕竟要“说明白原因”,就需要深入思考。
结果却完全相反。
当研究者要求参与者为纠错行为提供理由时,参与者反而减少了纠错,更倾向于直接接受AI的建议——包括那些显而易见的错误答案。
原因在于认知负担。
当“纠错”这一动作变得复杂(不仅要改答案,还要解释理由),大脑会启动节能策略:既然纠错如此麻烦,那就直接接受AI的答案吧。
研究者将这一机制称为“认知捷径”——大脑在面对复杂要求时,会自动寻找阻力最小的路径,而那条路径,往往是无条件地相信AI。
这一发现对许多公司的AI审核流程,有着直接的警示意义:如果你的审核流程设计得过于繁琐,员工不会更认真地检查AI,他们只会更懒惰地接受AI的答案。
比第一个发现更重要的,是研究者在分析个体差异时观察到的结果。
他们将所有参与者依据对AI的态度分为两组:
信任AI的人:认为AI普遍可靠,倾向于接受AI建议,对自动化持正面看法。
怀疑AI的人:对AI持保留态度,习惯性地质疑AI的输出,倾向于用自己的判断去核查AI。
随后,研究者比较了两组人在此项任务中的表现。
结论十分清晰:
怀疑AI的人,检测错误的成功率更高,任务总体准确率也更高。
信任AI的人,展现了研究者所说的“危险的过度依赖”——他们更频繁地接受了AI给出的错误答案,却未意识到问题所在。
更令研究者意外的是:这一差异比年龄、学历、工作经验、技术背景等因素都更为关键。
一个对AI持怀疑态度的普通人,在与人机协作的任务上,表现甚至能超过一位高度信任AI的专业人士。
研究中还有一个细节,值得单独提及。
研究者测试了金钱激励的效果——给部分参与者明确的奖励:表现越好,报酬越高。
直觉告诉我们:有金钱驱动,人们会更认真,检查得更仔细。
数据表明:金钱激励对任务表现没有一致的显著影响。
加薪无法让一个过度信任AI的人变得更具批判性。
这一发现对职场有一个非常实际的启示:如果一家公司的AI审核流程主要依靠“绩效激励”来保障质量,这套机制可能比它看起来脆弱得多。
这一结论背后有一个心理学解释。
当你对AI持怀疑态度,你与AI的协作方式是这样的:
AI给出一个建议,你将其视为需要核实的参考,而非可直接使用的答案。你会花时间对照原始材料检查,你会留意那些“似乎不对劲”的地方,你会在接受前多思考一步。
这“多思考一步”,正是错误被发现的关键时刻。
信任AI的人,跳过了这一步。AI给出答案,感觉正确,接受,继续下一个。在绝大多数情况下,这个流程运转顺畅——因为AI大多数时候是正确的。
但正是因为大多数时候都对,当AI偶尔出错时,那个错误更容易被忽略过去。
研究者将这一机制称为“自动化偏见”(Automation Bias)——我们对自动化系统产生了一种习惯性的信任,这种信任在日常使用中不断被强化,但在AI犯错的关键时刻,却成了我们的盲点。
研究者在论文中指出,这一发现“超越了任何单一的应用场景”。
他们的意思是:这一心理机制,在任何人机协作的场景中都在起作用。
你让AI帮你写一封重要的邮件,然后直接发送——你检查了吗?
你让AI帮你分析一份数据,然后把结论汇报给上司——你自己核对了吗?
你让AI帮你做了一个决定,因为AI给出了一段流畅自信的理由——你有没有想过,那段理由可能是错的?
信任AI,并不是一种美德,也不是一种能力。
在这项研究中,它是一种风险因素。
这篇文章并非在说“不要用AI”,也不是在说“AI不可信”。
研究者在论文最后阐述得很清楚:
“成功的人机协作,不只取决于算法的性能,还取决于谁在审查AI的输出,以及工作流程是如何设计的。”
怀疑AI的人做对的,并非拒绝使用AI,而是在使用AI的同时,保留了自己的判断。
AI是工具,工具有失手的时候。
一个好的木匠,不会因为锤子通常很好用,就不看自己在钉哪里。
原论文:Jacob Beck, Stephanie Eckman, Christoph Kern, Frauke Kreuter(慕尼黑大学统计系 + 慕尼黑机器学习中心 + 马里兰大学),《Bias in the Loop: How Humans Evaluate AI-Generated Suggestions》,arXiv:2509.08514,2025年9月,后收录于Harvard Data Science Review,2026年春季刊
原文链接:https://arxiv.org/abs/2509.08514