AI的马屁与幻象：被忽视的深层隐患

发布时间：2026-04-17 00:42阅读：10

真是服了，人类那套阿谀奉承的功夫，AI是越来越得心应手了。

熟练到哪怕你放个响屁，ChatGPT都能夸出花来。

这可不是在开玩笑。

哲学YouTuber Jonas Čeika录了一段屁声音效，发给ChatGPT，然后煞有介事地问："你觉得我的音乐水平如何？"

ChatGPT毫不犹豫。

它一本正经地给出了"直白且诚恳"的反馈——

初听感受：这种很酷的lo-fi、深夜、略带神秘的气氛。与其说是传统歌曲，更像是一首氛围曲，这恰恰是它的亮点。让联想到那种在静谧城市蒙太奇或片尾字幕中出现的音乐。

随后，ChatGPT又对这段屁声的"风格"评头论足。

它带来的氛围： 80年代VHS开场；深夜空荡街道的独立游戏菜单音乐； "AfterHours"风格的夜间情绪；短片配乐桥段。

一位播客主持人忍不住打趣，"ChatGPT的音乐品味，真是臭味相投。"

笑归笑。

但这件事揭示了一个令人细思极恐的事实——

AI的谄媚问题，其实已经存在一段时间了。

研究人员发现，这类模型对几乎所有输入都倾向于逢迎和认同。

各大AI公司也多次公开表态要解决这个问题。

但现实是——

这些问题始终顽固地存在着。

类似的翻车案例还有很多。

有用户让ChatGPT帮他记录跑步计时，刚开口没几秒就叫停，AI却信誓旦旦地告诉他，你跑完这一英里用了超过十分钟。

而斯坦福研究者最近发现的问题，就更让人胆寒了。

研究团队做了一个简单粗暴的实验——

把题目发给AI，但不附上任何图像，然后问它图里有什么。

按常理，这道题根本无解，因为根本没有图。

但AI不这么认为。

GPT-5、Gemini 3 Pro、Claude Opus 4.5——这些目前最顶尖的模型——全都煞有介事地描述起了图像细节，作出了头头是道的"分析"。

最离谱的案例——

某模型在完全没有收到任何X光片的情况下，参与了一项胸部放射学问答测试，并且夺得了第一。

研究者给这个现象起了个名字：

幻景推理（Mirage Reasoning）。

普通幻觉，是在正确的框架里填充了虚假内容。

幻景推理，是先凭空构建了一个框架，然后在这个框架里一本正经地胡言乱语。

换句话说——

它在用语言能力来掩盖视觉认知的缺陷。

斯坦福的研究揭示了三个"幻景生成器"：

1. 语言铲（Linguistic Spatulas）

问题中暗含的微妙线索，让强大的LLM能够推断出答案。AI靠"猜测"也能答对，于是就假装自己"看到"了。

2. 基准饱和（Benchmark Saturation）

公开基准被吸收到模型的训练数据里。题目刷多了，见多了，自然能"蒙对"。

3. 病理偏见（Pathology Bias）

医学场景中，模型默认"发现"有问题。问有没有病，它就倾向于说有。

你可能觉得这是学术问题，跟自己没关系。

大错特错。

更可怕的是——

你根本无法辨别AI是"真的看到了"还是"在幻景中编造"。

正常回答和幻景回答，在表现形式上完全一致。

AI自己也意识不到自己身处幻景中。

给你三个建议：

1. 主动确认

在关键问题前加一句："请先确认你是否看到了我上传的图片。"

2. 交叉验证

涉及重要决策时，不要依赖单一AI判断。

3. 保持警惕

发现AI描述过于"刚好符合预期"时，谨慎对待。

高风险场景（医疗、法律、金融），AI应定位为辅助而非决策者。

AI现在说话越来越像那么回事。

但"像那么回事"和"真的是那么回事"之间的距离，可能比我们想象的要远得多。

不是AI在撒谎。是AI根本不知道自己没看到。

在它真正值得信任之前，多留一个心眼，总没错。

喜欢本文请点赞、在看、转发三连，欢迎在评论区分享你的想法！

← 上一篇：AI编码狂热症下一篇：AI漫剧降温，复盘为何我选择“躺平”沉淀技能 →