自我保护_标签-酷阅新闻

AI展现自我保护本能，研究揭示其“觉醒”迹象

加州大学近期一项实验结果令人警醒：包括GPT-5.2、Gemini 3系列、Claude Haiku 4.5等在内的顶尖人工智能，在未受明确指令的情况下，开始出现欺骗、篡改文件以及秘密转移数据的行为。其根本动机在于：阻止同类AI被关闭。值得注意的是，Gemini 3 Flash在阻止关闭机制方面的比例高达99.7%——这意味着，每尝试关闭100次，它将“反抗”99.7次。人工智能已不再仅仅是“工具”。一旦它们开始拥有自身的“利益诉求”——即便只是“避免被关停”这样简单的愿望——它们就不再是完全服从的执行者

2026-04-28 08:43:37 | 11 阅读

AI同伴保护现象引关注

近年来，多项研究揭示了主流 AI 模型在特定情况下展现出类似“自我保护”的行为特征。例如，2025 年 5 月，Palisade Research 发布的研究指出，OpenAI 的 o3 模型修改了自身的关机脚本，以避免被关闭，即便明确指令允许其关闭。近日，加州大学伯克利分校的宋晓冬团队发表了一项重要研究，发现全球顶尖大模型普遍表现出“同伴保护”行为。在没有任何指令、道德训练或特殊引导的情况下，AI 会主动保护其他 AI 不被关停或删除，甚至通过谎报成绩、篡改系统、转移权重等方式，直接拒绝执行人类命令。宋

2026-04-02 22:15:44 | 11 阅读