模型篡改_标签-酷阅新闻

AI 防线失守：Meta 与谷歌模型安全机制数分钟内被破

现有多种软件工具能够剥离 Meta、谷歌 (379.38, -4.09, -1.07%) 等科技巨头人工智能模型的安全防护，目前市面上已涌现出数千个被篡改的版本，原有的管控约束荡然无存。记者利用代码托管平台 GitHub 上的特殊工具，在无需专业硬件支持的前提下，耗时不足十分钟便成功突破了 Meta Llama 3.3 模型的安全壁垒。那些原版模型拒绝回答的违规问题，在这些篡改版本中均能得到回应。此次事件加剧了监管机构与 AI 企业的忧虑：随着开源模型性能的日益增强，研发方所构建的安全防线将变得愈发脆弱。

2026-05-25 23:36:33 | 12 阅读