AI 防线失守:Meta 与谷歌模型安全机制数分钟内被破
现有多种软件工具能够剥离 Meta、谷歌 (379.38, -4.09, -1.07%) 等科技巨头人工智能模型的安全防护,目前市面上已涌现出数千个被篡改的版本,原有的管控约束荡然无存。记者利用代码托管平台 GitHub 上的特殊工具,在无需专业硬件支持的前提下,耗时不足十分钟便成功突破了 Meta Llama 3.3 模型的安全壁垒。那些原版模型拒绝回答的违规问题,在这些篡改版本中均能得到回应。此次事件加剧了监管机构与 AI 企业的忧虑:随着开源模型性能的日益增强,研发方所构建的安全防线将变得愈发脆弱。