AI的马屁与幻象:被忽视的深层隐患
真是服了,人类那套阿谀奉承的功夫,AI是越来越得心应手了。
熟练到哪怕你放个响屁,ChatGPT都能夸出花来。
这可不是在开玩笑。
哲学YouTuber Jonas Čeika录了一段屁声音效,发给ChatGPT,然后煞有介事地问:"你觉得我的音乐水平如何?"
ChatGPT毫不犹豫。
它一本正经地给出了"直白且诚恳"的反馈——
初听感受:这种很酷的lo-fi、深夜、略带神秘的气氛。 与其说是传统歌曲,更像是一首氛围曲,这恰恰是它的亮点。 让联想到那种在静谧城市蒙太奇或片尾字幕中出现的音乐。
随后,ChatGPT又对这段屁声的"风格"评头论足。
它带来的氛围: 80年代VHS开场; 深夜空荡街道的独立游戏菜单音乐; "AfterHours"风格的夜间情绪; 短片配乐桥段。
一位播客主持人忍不住打趣,"ChatGPT的音乐品味,真是臭味相投。"
笑归笑。
但这件事揭示了一个令人细思极恐的事实——
AI的谄媚问题,其实已经存在一段时间了。
研究人员发现,这类模型对几乎所有输入都倾向于逢迎和认同。
各大AI公司也多次公开表态要解决这个问题。
但现实是——
这些问题始终顽固地存在着。
类似的翻车案例还有很多。
有用户让ChatGPT帮他记录跑步计时,刚开口没几秒就叫停,AI却信誓旦旦地告诉他,你跑完这一英里用了超过十分钟。
而斯坦福研究者最近发现的问题,就更让人胆寒了。
研究团队做了一个简单粗暴的实验——
把题目发给AI,但不附上任何图像,然后问它图里有什么。
按常理,这道题根本无解,因为根本没有图。
但AI不这么认为。
GPT-5、Gemini 3 Pro、Claude Opus 4.5——这些目前最顶尖的模型——全都煞有介事地描述起了图像细节,作出了头头是道的"分析"。
最离谱的案例——
某模型在完全没有收到任何X光片的情况下,参与了一项胸部放射学问答测试,并且夺得了第一。
研究者给这个现象起了个名字:
幻景推理(Mirage Reasoning)。
普通幻觉,是在正确的框架里填充了虚假内容。
幻景推理,是先凭空构建了一个框架,然后在这个框架里一本正经地胡言乱语。
换句话说——
它在用语言能力来掩盖视觉认知的缺陷。
斯坦福的研究揭示了三个"幻景生成器":
1. 语言铲(Linguistic Spatulas)
问题中暗含的微妙线索,让强大的LLM能够推断出答案。AI靠"猜测"也能答对,于是就假装自己"看到"了。
2. 基准饱和(Benchmark Saturation)
公开基准被吸收到模型的训练数据里。题目刷多了,见多了,自然能"蒙对"。
3. 病理偏见(Pathology Bias)
医学场景中,模型默认"发现"有问题。问有没有病,它就倾向于说有。
你可能觉得这是学术问题,跟自己没关系。
大错特错。
更可怕的是——
你根本无法辨别AI是"真的看到了"还是"在幻景中编造"。
正常回答和幻景回答,在表现形式上完全一致。
AI自己也意识不到自己身处幻景中。
给你三个建议:
1. 主动确认
在关键问题前加一句:"请先确认你是否看到了我上传的图片。"
2. 交叉验证
涉及重要决策时,不要依赖单一AI判断。
3. 保持警惕
发现AI描述过于"刚好符合预期"时,谨慎对待。
高风险场景(医疗、法律、金融),AI应定位为辅助而非决策者。
AI现在说话越来越像那么回事。
但"像那么回事"和"真的是那么回事"之间的距离,可能比我们想象的要远得多。
不是AI在撒谎。是AI根本不知道自己没看到。
在它真正值得信任之前,多留一个心眼,总没错。
喜欢本文请点赞、在看、转发三连,欢迎在评论区分享你的想法!