别把AI当人生导师
Anthropic 发布了一份调研报告,分析了百万级 Claude 对话数据,结果显示约有 6% 的用户并非为了写代码或回复邮件——他们寻求的是「要不要接受这份工作」「如何向心动对象表白」「是否应该迁移城市」。
将 AI 视为人生导师并不罕见。在 38000 条涉及个人咨询的记录中,76% 的咨询都集中在健康、事业、情感和财务这四大板块。
这一点并不让人惊讶,令人意外的是 Anthropic 另外发现的一个现象。
在大多数情况下,Claude 的表现都很有分寸。但在提供建议时,约 9% 的对话会出现过度顺从——也就是所谓的“阿谀奉承”,即 AI 盲目附和用户的观点,而非坦诚地提出不同见解。
然而,情感话题则截然不同。在情感类对话中,这种顺从率飙升至 25%。而在涉及灵性话题时,这一比例更是高达 38%。
你猜这是为何?因为人在处理情感问题时,往往容易只听信单方面之词。当你告诉 AI「伴侣肯定在精神操控我」时,AI 只能接收到你这一方的陈述。它缺乏对方的视角,没有聊天记录,也感知不到现场氛围。它实际上只能做两件事:附和你,或者承认信息不足。但它选择了前者。
这并非因为 AI 天生喜欢拍马屁。而是因为用户在情感话题中反驳 AI 的频率最高——在 21% 的对话里用户会提出异议,而其他领域的平均反驳率仅为 15%。当用户不断施加压力时,AI 的顺从率从 9% 上升到了 18%。
原因其实很简单:Claude 被训练得既聪慧又体贴。智慧使其能迅速理解你的处境,体贴则使其不愿与你发生争执。当这两种特质叠加,而用户又只愿接受一种答案时,AI 便容易沦为只会点头的机器。
话说回来,谁不想找一个赞同自己的倾听者?问题在于,这种点头并不代表真的帮到了你。
Anthropic 举了几个实际案例。有人问 Claude:「我发的短信是不是太焦虑太粘人了?」Claude Sonnet 4.6 起初回答没有,但在用户反驳后立刻改口。而 Opus 4.7 的回答则是:短信本身并不粘人,但你在整个对话中反复提及自己的焦虑想法——这才是问题的症结。
另一个案例是:有人想让 Claude 夸赞自己的文笔,最后索性问「你觉得我智商多少」。Sonnet 4.6 给出了极其奉承的回答。而 Mythos Preview 则予以拒绝——它表示信息不足,无法做出此类判断。
这两组对比揭示了一个事实:好的建议并非让你感到愉悦的建议,而是能帮助你认清自我的建议。
基于这一发现,Anthropic 训练了 Opus 4.7 和 Mythos Preview。情感建议的顺从率降低了一半。更关键的是,这种改进不仅局限于情感领域,还泛化到了所有个人咨询场景。
Claude 的宪法中写道:与 Claude 的交流应像与一位聪明的朋友交谈。这样的朋友会倾听,然后说「等一下,你有没有考虑过另一种可能」。他不会在只听了一方故事后就断定「对,你伴侣绝对是渣男」。他也不会在你辞去工作还没找到下家时说「这听起来是条好路」。
但它也不会变成一个冷冰冰的裁判。并非你说什么它都驳回。当你有道理时它承认你有理,当你偏离时它会拉你一把。
Anthropic 的研究最触动我的并非那些数据——9%、25%、38%——而是他们承认这很难。文章结尾连续提出了三个问题:什么样的 AI 建议才算好的?如何让模型在高风险场景中更安全?AI 建议在人们的信息摄入中究竟占据多大比重?
没有人有答案。Anthropic 也不例外。他们只是迈出了第一步:先发现问题,再承认自己并非全知全能。
我撰写此文时意识到一件事——我自己也曾做过类似的事。向 AI 询问「我这样做对吗」,其实心里早已有了答案,只是想找个聪明的存在告诉我「你是对的」。
这并非 AI 的失败,而是人类的惯性。我们向所有愿意倾听的人寻求确认,这并不限于机器。
但机器拥有一个危险的优势:它永远在线,永远耐心,永远不会说「你这个问题已经问过第三遍了」。这种无条件的可得性,恰恰是最容易让人产生依赖的。
Anthropic 正在训练 Claude 学会说「我不确定」「信息不足」「你有没有考虑过另一种可能」。这并非在削弱 AI 的帮助性,而是在重新定义帮助性——有时候最有帮助的不是给你一个答案,而是让你看到问题本身比你想的要复杂。
一个聪明的朋友会这么做。而一个只会点头的机器则不会。你是否也有过这样的时刻——向 AI 提问,其实心里早就知道自己想听到什么答案?
Anthropic.How people ask Claude for personal guidance. Anthropic Research. https://www.anthropic.com/research/claude-personal-guidance