AI的虚假现实:幻觉现象解析
2023 年,纽约律师 Peter LoDuca 向联邦法院提交了一份诉状,引用了 6 个判例来支持自己的论点。法官逐个查证,发现这 6 个判例全部不存在。不是案号写错了,不是日期有偏差,而是从头到尾,一个都不存在。律师的回应是:"ChatGPT 向我保证它们是真实的。"
AI 幻觉,简单说就是 AI 编造了看似合理、实际上不存在的信息。
注意,这不是普通的"答错了"。答错题和编造信息是两回事。
你问"中国的首都是哪里",AI 回答"上海",这是答错了,但它没有编造任何东西。
你问"帮我查一下 2024 年关于数据跨境的司法解释",AI 给你一个文号、发布日期、条款内容,看起来像模像样,但实际上这份司法解释根本不存在。这就是幻觉。
两者的区别在于:答错是能力问题,幻觉是自信地编造。
更危险的是,幻觉的内容往往比正确答案更像"正确答案"。因为它不是随机出错,而是根据上下文"推理"出来的,逻辑自洽、用词专业、格式规范。你不查证,根本看不出破绽。
幻觉的危害不在 AI "说错了话",而在有人把它当真了。
开头那个纽约律师的故事不是孤例。
2024 年,印第安纳州律师 Rafael Ramirez 在退休基金诉讼中,三份简报引用了 ChatGPT 捏造的案件引文,被建议处以 15000 美元罚款。
2025 年,北京通州区法院审理商事纠纷时,原告代理人提交的多个"参考案例"全部是 AI 编造的。代理人的做法是:把案件事实喂给 AI,反复提问,让 AI 生成案例,然后直接复制粘贴提交法院。
2024 年底,印度班加罗尔税务法庭甚至直接在裁决中引用了 ChatGPT 生成的三项"最高法院判决",涉及 669 亿卢比的信托交易。一周后裁决被撤销,理由是"无意中的错误"。
甚至法官自己也会中招。2026 年初,印度安得拉邦一名民事法官在审理房产纠纷时,援引了四份 AI 生成的虚构判例。高院的裁定只有一句话:应"运用真实智能而非人工智能"。
2025 年,挪威男子 Arve Hjalmar Holmen 在 ChatGPT 里输入了自己的名字,发现 AI 给他编造了完整的人生故事:他杀死了自己的儿子,被判处 21 年监禁。这些指控完全没有事实依据,但 ChatGPT 围绕这个"事实"编出了详尽的细节。
2026 年,中国律师李小亮发现,在百度搜索自己的名字时,"AI 智能回答"直接显示"李小亮律师被判三年有期徒刑",还配了他穿律师袍的照片。搜索建议来自用户输入"李小亮律师被判几年",AI 就顺着这个暗示编出了完整的"判决内容"。
你问 AI "吃维生素C能预防感冒吗",它可能告诉你"研究证明有效"。你问"空调不制冷怎么办",它可能给你一个听起来很专业的排查步骤,但其中某一步是错的。
这些日常幻觉看起来不致命,但它们在悄悄塑造你的认知。你不会去查证每一个"小常识",但你可能会按 AI 说的去做。
要理解幻觉为什么发生,得先理解 AI 是怎么"思考"的。
大语言模型的工作原理,本质上是极致版的输入法联想。
你打字的时候,输入法会根据你前面的字,预测下一个字可能是什么。大模型做的事一样,只是规模大了几个数量级:它阅读了互联网上几乎所有的公开文本,学会了"在某个上下文中,下一个词最可能是什么"。
这个机制非常擅长"像人一样说话",但它有一个致命缺陷:它学的是语言的模式,不是事实本身。
模型知道"司法解释"这种文件通常长什么样、用什么措辞、怎么编号,但它不知道现实世界中到底有没有这份文件。当它需要输出一个"司法解释"时,它会按照学到的模式,生成一个看起来完全合理的版本。
人类在不确定的时候会说"我不确定",但大模型没有被训练成这样。
模型的训练目标是"给出最好的回答",不是"在不确定时拒绝回答"。当你问一个它没有确切信息的问题,它会倾向于编一个"最合理的答案",而不是说"我不知道"。
这就像一个从不认错的人:不管知不知道,它都会给你一个答案,而且语气坚定。
模型的"知识"来自训练数据,而互联网上的信息本身就充满错误。如果训练数据中包含错误信息,模型就会把这些错误当成"事实"来学习。
更麻烦的是,模型无法区分"广泛认可的事实"和"少数人的错误说法"。在它的世界里,只有"这个模式出现了多少次",没有"这个说法是否正确"。
理解了上面三点,你就会明白一个关键结论:幻觉是概率生成机制的必然副产品,不是可以通过简单修复消除的 bug。
模型每时每刻都在"猜测",而猜测就有猜错的概率。你可以降低这个概率(比如通过检索增强、多轮验证),但你不可能把它降到零。
这就像人类说话也会说错,但人类说错的时候会犹豫、会不确定,而 AI 不会。它永远自信,永远流畅,永远像真的。
幻觉无法消除,但可以防御。核心策略只有一个:不要对单一 AI 输出建立完全信任。
以下几种情况,幻觉的概率特别高:
方法一:交叉验证
重要的信息,至少找两个独立