标签

Claude一个月揪出上万高危漏洞,准确率九成!科技巨头集体入场,安全圈要变天

发布时间:2026-05-26 05:12来源:微信阅读:5

5月22日,Anthropic正式发布了Project Glasswing的首份阶段报告。

Project Glasswing是Anthropic主导的一项联合防御项目,核心目标非常清晰:在更强大的AI模型被恶意利用之前,优先识别并修补全球最关键的软件安全隐患。

启动仅一个月,Claude Mythos Preview与约50家合作伙伴共同扫描了超过1500个开源代码库,输出了23019条潜在风险线索。其中被判定为高危或严重级别的漏洞,突破了10000条大关。

传统安全团队一年能挖出几百个高危漏洞已属不易。AI用一个月时间完成了中型安全公司全年才能完成的工作量。

▲ Anthropic官方发布的Project Glasswing项目页面

发现漏洞只是起点。如果大量都是误报,那数字再华丽也没有实际意义。

Anthropic将其中1900条发现提交给第三方安全公司进行独立验证。结果显示:1726条被确认为真实有效,真阳性率达到90.8%。

十条线索九条属实。

做个对比:传统静态分析工具的误报率通常在30%到70%区间。Claude Mythos Preview直接将这一指标拉到了完全不同的层次。

独立安全平台KNOW评价道:Claude Mythos Preview是目前首款能够同时覆盖漏洞发现与验证全流程的模型。美国AI安全研究所(US AI Safety Institute)也给出了相似的结论。

▲ Wes Roth在X上分享的Project Glasswing完整漏洞处理流程图

参与Project Glasswing的合作方阵容堪称豪华:微软、苹果、谷歌、Cloudflare,以及超过50家技术机构。

几个标志性案例:

CrowdStrike利用Claude Mythos Preview在Firefox 145中发现了271个安全漏洞。

Mozilla的数据更为惊人——Claude Mythos Preview找到的漏洞数量,是此前Claude Opus 4.5人工测试结果的十倍以上。

还有一个高危案例值得注意:Claude Mythos Preview在MySQL中发现了一个CVSS评分高达9.1的严重漏洞,攻击者可以利用它伪造证书、冒充合法服务。

▲ 官方公布的Project Glasswing早期成果与合作伙伴验证数据

看完整的处理链路:

1596份漏洞报告,最终只有97个补丁落地。发现端与修复端的比例差距高达16倍。

Anthropic在官方博客中指出:

「过去,软件安全的发展速度取决于发现新漏洞的效率。现在,取决于验证、披露和修复AI产出的大量漏洞的速度。」

当AI能够批量输出高质量漏洞线索时,安全团队的工作重心被迫发生了转移。之前最稀缺的能力是发现漏洞,现在最稀缺的变成了处理漏洞。

AI发现漏洞的能力已得到充分验证。但后续问题更加棘手:

谁来修复?开源项目的维护者本身就面临人手和资金短缺。大量高质量漏洞报告突然涌入,处理压力将成倍增长。

谁来审核?每条漏洞都需要人工确认影响范围、制定修复方案、协调上下游依赖关系。这部分工作目前还没有被AI替代。

谁来买单?扫描1500个开源项目消耗的算力和token成本由谁承担?当AI安全成为基础设施级别的服务时,定价模型还没有标准答案。

谁来担责?如果AI漏报了某个高危漏洞,或者误报导致维护者浪费大量时间,责任如何划分?

Anthropic提到了他们的协调漏洞披露(Coordinated Vulnerability Disclosure)政策:给予维护者90天修复窗口,先报告再公开。但在漏洞数量暴涨的背景下,这套框架能否继续支撑,是一个悬而未决的问题。

▲ The Hacker News报道:Claude Mythos AI在常用软件中发现10000个高危漏洞

从技术角度审视,Project Glasswing验证了一个方向:AI在代码安全领域已从辅助角色跨越到独立产出阶段。23019条候选发现、90.8%的准确率、涵盖微软苹果谷歌的合作伙伴矩阵——这条路走得通。

但效率提升从来都有代价。

AI降低了发现漏洞的门槛,但后续的验证、披露、修复和治理工作量并没有同步降低。发现端的产出速度是修复端的16倍,整个安全生态需要重新分配资源。

开源维护者需要更多支持,企业安全团队需要新的工作流程,法务和合规部门需要更新对AI生成安全报告的处理规范。

Anthropic表示正在考虑如何向更多组织开放Mythos级别的模型。这意味着这个能力未来可能不只属于50家合作伙伴,而是整个行业都能使用。

当每个人都能用AI挖漏洞的时候,安全行业的游戏规则,将彻底改变。

— END —