AI 代理为何需要自我审视
AI Agent 为什么要学会「怀疑自己」
我们花费大量精力探讨 AI 的功能,却鲜少关注 AI 应如何审视自身产出。一个具备批判性思维的 Agent,与仅能遵从指令的 Agent 之间,差异并非源于算力,而在于一种近乎违背本能的能力——主动审视其刚刚得出的结论。
一个值得留意的细节是:早期 AI 助手,在你提问时,会毫不迟疑地流畅给出答案。尽管答案可能不准确,但其语气始终坚定。这种「永不怀疑」的特质,曾一度被视为优点加以宣传。然而,人们后来才意识到,这恰恰是最具风险之处。一个从不自我质疑的系统,会将错误包装得与正确同样体面。
批判性思维并非「更加审慎」,而是一种架构能力
许多人将 AI Agent 的批判性思维误解为「回答时附加一些免责声明」,这是对概念的偏差。真正的批判性思维是嵌入 Agent 决策流程中的一种元认知机制——它并非在结果上附加标签,而是在推理过程中持续地追问:「我当前的判断,其依据是什么?这些依据是否可靠?」
这在结构上与人类的批判性思维极为相似。心理学家将人类思维划分为两个系统:系统一负责快速直觉,系统二负责缓慢推理。批判性思维的本质是用系统二来审查系统一的输出。AI Agent 的批判性思维执行着相同的任务——不同之处在于,它的「系统一」是语言模型的下一个 token 预测,而「系统二」则是一套围绕该预测构建的验证与反思循环。
3
一个 Agent 完成批判性思考的最少步骤:生成答案、自我质疑、修正或放弃
它具体在「怀疑」什么
将批判性思维在 Agent 中拆解,大约可以分为三个层面的怀疑对象。
1怀疑信息