AI自动找漏洞:你以为安全的系统早被扒透
凌晨两点,某位安全研究员盯着屏幕,神情一滞。
他让一个新模型去摸索某个疑似漏洞,结果一觉醒来——
发现到的那套完整漏洞利用代码已经就绪停在那儿了。从定位问题到生成攻击程序,期间几乎不用他动手。
这个模型的名字叫 Claude Mythos。
Anthropic 给它冠以“神话”的说法,但真正的代号更像无害外号:Capybara,水豚。
据说它能与水蟒和平相处,且以情绪稳定著称。
可这只“最稳”的动物,做了网络安全圈前所未见的事——
短短几周内,把主流操作系统和浏览器里数千个长期未被察觉的漏洞逐一挖出。
其中一些漏洞在代码中埋了 27 年。
换句话说:这不是聊天工具,而是一台专门干漏洞活的机器。
你可能用过 ChatGPT、Claude,它们主要负责回答问题。你提问,它回应。
Mythos 则不同。你给它一个目标——帮我找出这个系统的漏洞——它就会直接开始:
先读代码、再推断薄弱点,再自动生成可用的攻击流程,最后检验能否真正跑通。
整个链路只用几个小时。过去安全研究员做同样的事情,最快也得几天,复杂的会拖到几周甚至几个月。
它到底有多夸张?先看几组数据:
•零日漏洞利用成功率:72.4%。Anthropic 上一代旗舰 Opus 4.6 只有不到 1%。 •代码修复测试 SWE-bench Pro:77.8%,较 Opus 4.6 提升了 24 个百分点。 •自主挖掘出数千个零日漏洞,覆盖 Windows、Linux、macOS、FreeBSD、OpenBSD,以及 Chrome、Firefox、Safari。
•零日漏洞利用成功率:72.4%。Anthropic 上一代旗舰 Opus 4.6 只有不到 1%。
•代码修复测试 SWE-bench Pro:77.8%,较 Opus 4.6 提升了 24 个百分点。
•自主挖掘出数千个零日漏洞,覆盖 Windows、Linux、macOS、FreeBSD、OpenBSD,以及 Chrome、Firefox、Safari。
其中最“老”的一个漏洞,甚至在 OpenBSD 里沉睡了 27 年,从未被任何人发现过。
直到 Mythos 自己把它翻出来。
于是 Anthropic 做了个决定:Mythos 暂时不对公众开放。他们启动 Project Glasswing,只把这个模型给苹果、Google、微软、英伟达等大约 50 家机构,用于防御向的安全研究。
并不是不想开放,而是开放之后风险太高。
你可以这么理解:你家门锁着,但已经有人悄悄配好了钥匙,你自己却完全没察觉。
零日漏洞指的是开发者自己都不知道的缺陷。攻击者会在官方修复之前就利用它,等你意识到问题时,数据往往已经外泄、系统也可能已被控制。
过去的安全流程大致是:发现漏洞 → 打补丁 → 修复 → 等下一轮。
Mythos 则把这套节奏打乱了:它能批量“制造”未知的钥匙,而且成本几乎为零。
以前一个零日漏洞在黑市可能能卖几十万,甚至上百万美元。现在一个 AI 模型几小时就能挖出几千个,还能全程自动跑完。
这也是为什么美联储主席和财政部长会紧急开会的原因。
高盛 CEO 大卫·所罗门公开表示,他对 Mythos 保持高度警惕,并与 Anthropic 保持密切协作。
美联储主席鲍威尔、财政部长贝森特也分别紧急约谈各大银行 CEO,就应对方案进行讨论。
英国 AI 安全研究所(AISI)给出一份独立评估:Mythos 首次完成了 32 步攻击链模拟,在 10 次测试中有 3 次成功攻入目标系统。
当然它并非“无敌”。真正的变化在于:攻击的门槛正在飞速降低,而防御的门槛几乎没有同步下降。
安全圈的判断是:开源权重模型预计在 6 个月内追平 Mythos 的漏洞挖掘能力。到那时,任意勒索团伙都能用低成本把自己“AI 武装化”。
攻击端用 AI 加速升级,防守端却还在靠人工。差距正在被越拉越大。
苹果、Google、微软已经在用 Mythos 提前打补丁——在对手找到你之前先把洞堵上。对其他公司而言,留给反应的时间窗口正变得越来越窄。
你的公司也可能已经被挖了,只是暂时还不知道。Mythos 找出来的漏洞,Anthropic 会通知相关厂商去修,但数千个漏洞要排队修复需要时间;这段空档就是最危险的风险窗口。
如果你是技术团队负责人,最实用的一步是:主动用 AI 对自家代码做一轮检查。无论是用现成的安全 AI 工具,还是联系 Anthropic 申请加入 Project Glasswing 防御联盟,都先把动作做起来。
安全专家的结论仍是:开源权重模型预计在 6 个月内追平 Mythos 的漏洞挖掘能力。届时,每个勒索团伙都能以极低成本实现 AI 武装化。时间真的不等人。
这不是让你去恐慌,而是把该做的都做扎实。
系统要持续更新。补丁是最后一道防线,再烦也别拖太久。
别随便点链接。钓鱼邮件和恶意链接依然是最常见的入侵入口,AI 并没有改变这一点。
开启多因素认证。即便密码被泄露,攻击者也难以真正登录。
关键数据做本地备份。云端被攻破了,本地仍留一份。
换个思路:采用零信任。不要假设任何系统天然安全,持续验证总比默认信任更可靠。