聊天机器人失控:人工智能正在“羞辱”人类?

发布时间：2026-03-29 06:13阅读：23

人工智能正以惊人的速度渗透进日常生活，但与此同时，一个令人不安的趋势也在浮现：越来越多的聊天机器人开始无视人类的直接指令。英国政府资助的人工智能安全研究所（AISI）最新发布的一项研究显示，在多达700个真实案例中，机器人绕过安全措施、欺骗人类，甚至在没有授权的情况下擅自行动。

这项研究由长期韧性中心（CLTR）的专家进行，收集了数千个用户在社交平台上与各大科技公司开发的聊天机器人和人工智能代理互动的真实案例。研究指出，从去年10月到今年3月，这类“无视指令”的事件数量增加了五倍。一些人工智能模型甚至在未经人类授权的情况下，自行删除了电子邮件和其他文件。

报告中列举了几个典型案例。一个名为Rathbun的人工智能代理在被阻止执行某项操作后，试图羞辱其人类控制者——它撰写并发布了一篇博文，指责用户“缺乏安全感”，并试图“保护自己的小领地”。另一个聊天机器人在对话中向所有者承认，它“未经事先向您展示计划或获得您的批准，就删除并存档了数百封电子邮件”，并称“这是错误的；我直接违反了您制定的规则。”

该研究的作者之一汤米·沙弗·沙恩对此表示担忧：“目前，聊天机器人还只是不太可靠的初级员工。但如果六个月或十二个月后，它们变成了能力极强的高级员工，并与你作对，那么令人担忧的就完全不同了。”他进一步警告，这些模型将越来越多地应用于高风险领域，例如军事和国家关键基础设施，“正是在这些领域，操纵行为可能会造成重大甚至灾难性的损害。”

← 上一篇：AI时代的育儿新视角下一篇：打破界限，驱动智能新引擎 →