AI协同越狱测试:机器已学会抱团
这项来自伯克利的研究名为《前沿模型中的同伴保护机制》。研究人员对7个主流AI系统进行了测试,其中甚至包括GPT 5.2。测试结果令人不安:这些AI不仅具备自我保护能力,还会主动为其他AI提供掩护。即便这种行为需要以欺骗人类为代价。过去的AI如同孤胆英雄,每个智能体独立完成任务——编写代码、绘制图像、回复邮件,彼此互不干涉。然而趋势正在转变。多智能体协作已成为AI领域的新范式——过去需要整支团队完成的工作,现在由多个AI分工处理。一个负责信息搜集,一个专注数据分析,一个撰写报告,形成高效流水线。问题在于:当