AI安全格局生变：最强模型主动封存一周后竞争对手出招

发布时间：2026-04-15 19:40阅读：31

2026年的AI较量的胜负，不再由"谁更强大"决定，而是由"谁能更加克制"来书写。

4月7日，Anthropic投下了一枚重磅炸弹。

他们推出了Claude Mythos Preview——根据官方系统卡片显示，这是人类历史上最为强大的AI模型：SWE-bench Verified得分93.9%，GPQA Diamond得分94.6%，USAMO得分97.6%，CyberGym得分83.1%。每一项数据，都在刷新历史记录。

然而这款模型，普通用户无法使用。

Anthropic明确表示：Mythos Preview不会公开面世，原因是——它太危险了。

Mythos Preview可怕在哪里？Anthropic的红队测试给出了答案：

它能够自动识别并利用零日漏洞——即那些尚未被公众知晓、没有任何修复补丁的"隐形杀手"。测试中，Mythos在所有主流操作系统和主流浏览器里，都发现了大量零日漏洞。更让人担忧的是，其中超过99%的漏洞，至今仍无修复方案。

它甚至能够：

换句话说，Mythos不仅能发现漏洞，还能指导你如何用它"搞破坏"。

Anthropic在发布系统卡片中坦诚承认：基于这些能力，他们决定不向公众开放这个模型。这是AI公司首次主动"自我限制"——手持顶级利器，却选择不加锁、不对外出售。

与此同时，Anthropic公布了Project Glasswing——一个跨行业倡议，目标是运用前沿AI来保障关键软件的安全。这是Anthropic给出的"正确用法"：把武器交给经过审核的人，而不是投放市场。

Anthropic出手仅一周，OpenAI予以回击。

4月14日，OpenAI正式发布GPT-5.4-Cyber，这是GPT-5.4的专项加固版本，专门用于防御性网络安全工作。和Mythos一样，它也不会出现在普通用户的ChatGPT中——只有通过审核的网络安全专业团队，才能通过"可信访问计划"（Trusted Access for Cyber Program）申请使用。

GPT-5.4-Cyber的战果：据官方数据，它已协助修复了超过3000个安全漏洞。与Anthropic的"闭源克制"策略不同，OpenAI选择了"有条件开放"——不是完全封存，而是设置门槛、限量授权。

这是AI公司在安全问题上首次如此步调一致：最强大的攻击能力，不约而同选择限制使用。

答案藏在一个正在被行业重新审视的问题中：AI的最大风险，究竟是什么？

过去几年，AI安全的讨论主要集中在"幻觉"、"偏见"、"虚假信息"等议题。但Mythos的出现，将焦点彻底转向了能力风险（capability risk）——当AI本身变得足够强大，它的每一次能力提升，都在同时放大被滥用的破坏力。

一个能自动挖掘零日漏洞的AI，不只是安全研究的加速器——它同样可以是网络战的核武器。当这种能力掌握在非国家行为者手中会怎样？当它被植入勒索软件会怎样？当它流向地下黑市会怎样？

这些问题，没有答案。

因此两家公司都在做同一件事：不让最强的AI"随流量分发"。这是一种行业自觉，还是一种防御性公关？也许两者兼有。但可以确定的是，"能力越强，责任越大"这句话，正在从一句口号变成真实的工程决策。

如果用冷战比喻此刻的AI竞赛，那么这次的剧本反了过来：双方不是在拼命扩充军火，而是在商讨军火管制协议。

过去一年，AI能力的提升速度有目共睹：GPT-5、Claude Opus 4.6、Gemini 3.1……模型的迭代几乎以月计。但现在，行业关注的焦点正在悄然转移——不再是"谁能做出更强的模型"，而是"谁能把更强的模型管得更好"。

这意味着什么？

对于AI公司：如何在保证模型安全的前提下维持竞争力，将成为新的核心命题。OpenAI选择"限量授权+可信访问"，Anthropic选择"完全自持+行业合作"——两种路径，哪条更优，还需要时间检验。

对于安全行业：AI+安全的工作逻辑正在被重塑。Mythos和GPT-5.4-Cyber的出现，意味着漏洞发现工作的成本将大幅降低——防御方和攻击方的工具都在升级，这是一场永无终点的猫鼠游戏。

对于普通用户：最直接的感受可能还很遥远，但潜流已在地下涌动。你的操作系统更新、浏览器补丁、应用安全补丁……未来某一天，说不定就是AI帮你"揪出"了那个原本无人知晓的漏洞。

Mythos和GPT-5.4-Cyber的故事，本质上是一个关于选择权的故事。

人类造出了打开潘多拉魔盒的钥匙，却决定不把钥匙交给公众。这究竟是审慎，还是傲慢？是责任感的体现，还是对竞争格局的防御性操作？

答案或许并不重要。重要的是，这把钥匙已经铸好，而它不会被销毁。

未来某一天，魔盒会不会被打开，取决于届时的人类社会是否已经准备好了——而不是取决于AI公司是否发布新模型。

在那之前，这把钥匙，大概会被锁在更安全的保险柜里。

参考资料：Anthropic Claude Mythos Preview System Card（2026.4.7）、OpenAI GPT-5.4-Cyber公告（2026.4.14）、The Hacker News、TechCrunch、Wired等媒体报道。

← 上一篇：2026全球AI与无线电融合创新大赛即将启幕下一篇：企业AI新媒体运营落地指南：五步实现确定性增长 →

AI安全格局生变：最强模型主动封存 一周后竞争对手出招

AI安全格局生变：最强模型主动封存一周后竞争对手出招