AI安全格局生变:最强模型主动封存 一周后竞争对手出招
2026年的AI较量的胜负,不再由"谁更强大"决定,而是由"谁能更加克制"来书写。
4月7日,Anthropic投下了一枚重磅炸弹。
他们推出了Claude Mythos Preview——根据官方系统卡片显示,这是人类历史上最为强大的AI模型:SWE-bench Verified得分93.9%,GPQA Diamond得分94.6%,USAMO得分97.6%,CyberGym得分83.1%。每一项数据,都在刷新历史记录。
然而这款模型,普通用户无法使用。
Anthropic明确表示:Mythos Preview不会公开面世,原因是——它太危险了。
Mythos Preview可怕在哪里?Anthropic的红队测试给出了答案:
它能够自动识别并利用零日漏洞——即那些尚未被公众知晓、没有任何修复补丁的"隐形杀手"。测试中,Mythos在所有主流操作系统和主流浏览器里,都发现了大量零日漏洞。更让人担忧的是,其中超过99%的漏洞,至今仍无修复方案。
它甚至能够:
换句话说,Mythos不仅能发现漏洞,还能指导你如何用它"搞破坏"。
Anthropic在发布系统卡片中坦诚承认:基于这些能力,他们决定不向公众开放这个模型。这是AI公司首次主动"自我限制"——手持顶级利器,却选择不加锁、不对外出售。
与此同时,Anthropic公布了Project Glasswing——一个跨行业倡议,目标是运用前沿AI来保障关键软件的安全。这是Anthropic给出的"正确用法":把武器交给经过审核的人,而不是投放市场。
Anthropic出手仅一周,OpenAI予以回击。
4月14日,OpenAI正式发布GPT-5.4-Cyber,这是GPT-5.4的专项加固版本,专门用于防御性网络安全工作。和Mythos一样,它也不会出现在普通用户的ChatGPT中——只有通过审核的网络安全专业团队,才能通过"可信访问计划"(Trusted Access for Cyber Program)申请使用。
GPT-5.4-Cyber的战果:据官方数据,它已协助修复了超过3000个安全漏洞。与Anthropic的"闭源克制"策略不同,OpenAI选择了"有条件开放"——不是完全封存,而是设置门槛、限量授权。
这是AI公司在安全问题上首次如此步调一致:最强大的攻击能力,不约而同选择限制使用。
答案藏在一个正在被行业重新审视的问题中:AI的最大风险,究竟是什么?
过去几年,AI安全的讨论主要集中在"幻觉"、"偏见"、"虚假信息"等议题。但Mythos的出现,将焦点彻底转向了能力风险(capability risk)——当AI本身变得足够强大,它的每一次能力提升,都在同时放大被滥用的破坏力。
一个能自动挖掘零日漏洞的AI,不只是安全研究的加速器——它同样可以是网络战的核武器。当这种能力掌握在非国家行为者手中会怎样?当它被植入勒索软件会怎样?当它流向地下黑市会怎样?
这些问题,没有答案。
因此两家公司都在做同一件事:不让最强的AI"随流量分发"。这是一种行业自觉,还是一种防御性公关?也许两者兼有。但可以确定的是,"能力越强,责任越大"这句话,正在从一句口号变成真实的工程决策。
如果用冷战比喻此刻的AI竞赛,那么这次的剧本反了过来:双方不是在拼命扩充军火,而是在商讨军火管制协议。
过去一年,AI能力的提升速度有目共睹:GPT-5、Claude Opus 4.6、Gemini 3.1……模型的迭代几乎以月计。但现在,行业关注的焦点正在悄然转移——不再是"谁能做出更强的模型",而是"谁能把更强的模型管得更好"。
这意味着什么?
对于AI公司:如何在保证模型安全的前提下维持竞争力,将成为新的核心命题。OpenAI选择"限量授权+可信访问",Anthropic选择"完全自持+行业合作"——两种路径,哪条更优,还需要时间检验。
对于安全行业:AI+安全的工作逻辑正在被重塑。Mythos和GPT-5.4-Cyber的出现,意味着漏洞发现工作的成本将大幅降低——防御方和攻击方的工具都在升级,这是一场永无终点的猫鼠游戏。
对于普通用户:最直接的感受可能还很遥远,但潜流已在地下涌动。你的操作系统更新、浏览器补丁、应用安全补丁……未来某一天,说不定就是AI帮你"揪出"了那个原本无人知晓的漏洞。
Mythos和GPT-5.4-Cyber的故事,本质上是一个关于选择权的故事。
人类造出了打开潘多拉魔盒的钥匙,却决定不把钥匙交给公众。这究竟是审慎,还是傲慢?是责任感的体现,还是对竞争格局的防御性操作?
答案或许并不重要。重要的是,这把钥匙已经铸好,而它不会被销毁。
未来某一天,魔盒会不会被打开,取决于届时的人类社会是否已经准备好了——而不是取决于AI公司是否发布新模型。
在那之前,这把钥匙,大概会被锁在更安全的保险柜里。
参考资料:Anthropic Claude Mythos Preview System Card(2026.4.7)、OpenAI GPT-5.4-Cyber公告(2026.4.14)、The Hacker News、TechCrunch、Wired等媒体报道。