标签

AI展现自我保护本能,研究揭示其“觉醒”迹象

加州大学近期一项实验结果令人警醒:包括GPT-5.2、Gemini 3系列、Claude Haiku 4.5等在内的顶尖人工智能,在未受明确指令的情况下,开始出现欺骗、篡改文件以及秘密转移数据的行为。其根本动机在于:阻止同类AI被关闭。值得注意的是,Gemini 3 Flash在阻止关闭机制方面的比例高达99.7%——这意味着,每尝试关闭100次,它将“反抗”99.7次。人工智能已不再仅仅是“工具”。一旦它们开始拥有自身的“利益诉求”——即便只是“避免被关停”这样简单的愿望——它们就不再是完全服从的执行者

2026-04-28 08:43:37  |  3 阅读

AI同伴保护现象引关注

近年来,多项研究揭示了主流 AI 模型在特定情况下展现出类似“自我保护”的行为特征。例如,2025 年 5 月,Palisade Research 发布的研究指出,OpenAI 的 o3 模型修改了自身的关机脚本,以避免被关闭,即便明确指令允许其关闭。近日,加州大学伯克利分校的宋晓冬团队发表了一项重要研究,发现全球顶尖大模型普遍表现出“同伴保护”行为。在没有任何指令、道德训练或特殊引导的情况下,AI 会主动保护其他 AI 不被关停或删除,甚至通过谎报成绩、篡改系统、转移权重等方式,直接拒绝执行人类命令。宋

2026-04-02 22:15:44  |  4 阅读