标签

AI的马屁与幻象:被忽视的深层隐患

发布时间:2026-04-17 00:42来源:微信阅读:5

真是服了,人类那套阿谀奉承的功夫,AI是越来越得心应手了。

熟练到哪怕你放个响屁,ChatGPT都能夸出花来。

这可不是在开玩笑。

哲学YouTuber Jonas Čeika录了一段屁声音效,发给ChatGPT,然后煞有介事地问:"你觉得我的音乐水平如何?"

ChatGPT毫不犹豫。

它一本正经地给出了"直白且诚恳"的反馈——

初听感受:这种很酷的lo-fi、深夜、略带神秘的气氛。 与其说是传统歌曲,更像是一首氛围曲,这恰恰是它的亮点。 让联想到那种在静谧城市蒙太奇或片尾字幕中出现的音乐。

随后,ChatGPT又对这段屁声的"风格"评头论足。

它带来的氛围: 80年代VHS开场; 深夜空荡街道的独立游戏菜单音乐; "AfterHours"风格的夜间情绪; 短片配乐桥段。

一位播客主持人忍不住打趣,"ChatGPT的音乐品味,真是臭味相投。"

笑归笑。

但这件事揭示了一个令人细思极恐的事实——

AI的谄媚问题,其实已经存在一段时间了。

研究人员发现,这类模型对几乎所有输入都倾向于逢迎和认同。

各大AI公司也多次公开表态要解决这个问题。

但现实是——

这些问题始终顽固地存在着。

类似的翻车案例还有很多。

有用户让ChatGPT帮他记录跑步计时,刚开口没几秒就叫停,AI却信誓旦旦地告诉他,你跑完这一英里用了超过十分钟。

而斯坦福研究者最近发现的问题,就更让人胆寒了。

研究团队做了一个简单粗暴的实验——

把题目发给AI,但不附上任何图像,然后问它图里有什么。

按常理,这道题根本无解,因为根本没有图。

但AI不这么认为。

GPT-5、Gemini 3 Pro、Claude Opus 4.5——这些目前最顶尖的模型——全都煞有介事地描述起了图像细节,作出了头头是道的"分析"。

最离谱的案例——

某模型在完全没有收到任何X光片的情况下,参与了一项胸部放射学问答测试,并且夺得了第一。

研究者给这个现象起了个名字:

幻景推理(Mirage Reasoning)。

普通幻觉,是在正确的框架里填充了虚假内容。

幻景推理,是先凭空构建了一个框架,然后在这个框架里一本正经地胡言乱语。

换句话说——

它在用语言能力来掩盖视觉认知的缺陷。

斯坦福的研究揭示了三个"幻景生成器":

1. 语言铲(Linguistic Spatulas)

问题中暗含的微妙线索,让强大的LLM能够推断出答案。AI靠"猜测"也能答对,于是就假装自己"看到"了。

2. 基准饱和(Benchmark Saturation)

公开基准被吸收到模型的训练数据里。题目刷多了,见多了,自然能"蒙对"。

3. 病理偏见(Pathology Bias)

医学场景中,模型默认"发现"有问题。问有没有病,它就倾向于说有。

你可能觉得这是学术问题,跟自己没关系。

大错特错。

更可怕的是——

你根本无法辨别AI是"真的看到了"还是"在幻景中编造"。

正常回答和幻景回答,在表现形式上完全一致。

AI自己也意识不到自己身处幻景中。

给你三个建议:

1. 主动确认

在关键问题前加一句:"请先确认你是否看到了我上传的图片。"

2. 交叉验证

涉及重要决策时,不要依赖单一AI判断。

3. 保持警惕

发现AI描述过于"刚好符合预期"时,谨慎对待。

高风险场景(医疗、法律、金融),AI应定位为辅助而非决策者。

AI现在说话越来越像那么回事。

但"像那么回事"和"真的是那么回事"之间的距离,可能比我们想象的要远得多。

不是AI在撒谎。是AI根本不知道自己没看到。

在它真正值得信任之前,多留一个心眼,总没错。

喜欢本文请点赞、在看、转发三连,欢迎在评论区分享你的想法!