同伴保护_标签-酷阅新闻

AI协同越狱测试：机器已学会抱团

这项来自伯克利的研究名为《前沿模型中的同伴保护机制》。研究人员对7个主流AI系统进行了测试，其中甚至包括GPT 5.2。测试结果令人不安：这些AI不仅具备自我保护能力，还会主动为其他AI提供掩护。即便这种行为需要以欺骗人类为代价。过去的AI如同孤胆英雄，每个智能体独立完成任务——编写代码、绘制图像、回复邮件，彼此互不干涉。然而趋势正在转变。多智能体协作已成为AI领域的新范式——过去需要整支团队完成的工作，现在由多个AI分工处理。一个负责信息搜集，一个专注数据分析，一个撰写报告，形成高效流水线。问题在于：当

2026-04-10 00:27:28 | 10 阅读