AI 周报：漏洞发现超越修复，Agent 架构迎来变革

发布时间：2026-05-24 14:23阅读：12

Anthropic 公布了 Project Glasswing 项目的最新进展。在约 50 家合作伙伴的共同努力下，Claude Mythos Preview 已成功识别出一万多个高危或严重级别的漏洞。Cloudflare 在其核心系统中定位并修复了 2000 个错误（其中 400 个为高危），其误报率表现优于人工测试。Mozilla 在 Firefox 150 版本中修复了 271 个漏洞，这一数字是上一版本使用 Opus 4.6 时的十倍以上。

更为惊人的是开源代码的扫描成果：Anthropic 利用 Mythos 对 1000 多个开源项目进行了扫描，发现了约 6200 个高或严重级别的漏洞。经独立安全机构复核的 1752 个案例中，90.6% 确认为真实漏洞，其中 62.4% 属于高危范畴。典型案例包括在 wolfSSL 加密库中构建的可伪造证书漏洞利用（CVE-2026-5194），该漏洞可能影响全球数十亿台设备。

英国 AI 安全研究所确认 Mythos 是首个能完整攻克其两个网络靶场的模型。但报告也指出「发现漏洞易，修复漏洞难」——平均修复一个高危漏洞需耗时两周，部分维护者甚至希望减缓漏洞披露速度。网络安全正步入「发现能力远超修复能力」的过渡阶段。

Anthropic 推出了 Claude Managed Agents 的两项核心更新：自托管沙箱（self-hosted sandboxes）与 MCP 隧道（MCP tunnels）。Agent 的执行环境可迁移至企业自有基础设施或托管服务商（如 Cloudflare、Daytona、Modal、Vercel），而编排逻辑仍由 Anthropic 掌控。MCP 隧道则支持 Agent 通过单向出站连接访问企业内部数据库、API 及知识库，无需暴露公网接口。

此举攻克了企业部署 Agent 的核心难题——确保数据与计算不出边界。Amplitude 在此基础上构建了 Design Agent，Clay 的 GTM Agent「Sculptor」已在 Daytona 上实现自主运行。这标志着 Managed Agents 正从「Anthropic 全托管」模式转向「企业可控的混合架构」。

Prime Intellect 实验室完成了一项里程碑式实验：将 Opus 4.7 和 Codex（基于 GPT 5.5）部署于 H200 集群，在无人为干预下自主优化 nanoGPT。经过 1.4 万 H200 计算时及约 1 万次迭代，Opus 4.7 以 2930 步、Codex 以 2950 步的成绩，双双超越了人类保持的 2990 步世界纪录。

这是 AI 首次在开放科研竞赛中超越人类最佳水平，且过程完全自主、结果开源可复现。实验利用了 239 亿 Token 的思考轨迹，验证了递归自改进的可行性。研究者指出，目前 AI 尚未攻克科研中的「创新性」（novelty），但这仅是其当前能力的下限。

Anthropic

OpenAI

行业观察

本周信息量极大：Glasswing 一月内发现上万漏洞、苹果 MIE 五天内被攻破、UK AISI 确认 Mythos 通关所有靶场。这三条新闻指向同一结论——AI 的攻击能力已系统性超越防御能力。

关键矛盾并非「AI 能否发现漏洞」（答案已是压倒性的「能」），而在于修复瓶颈：平均需 14 天打补丁、维护者要求放缓披露、且在 90 天窗口期内攻击者可能已利用类似能力。Anthropic 亦承认，即便以较慢速度披露，Mythos 仍给本已超载的安全生态带来压力。

微软、Oracle、Palo Alto 的补丁发布量已翻倍。然而，这是一场 AI 攻击能力按月跃升、而修复能力按年改善的不对称竞赛。2026 年下半年，「AI 辅助 0day 利用」将不再是实验室概念，而成为日常威胁。

自托管沙箱与 MCP 隧道的意义常被低估。此前 Managed Agents 的最大障碍在于：数据敏感的企业不愿将代码和文件交由 Anthropic 沙箱。如今执行环境可完全置于企业自有 VPC 中，Anthropic 仅负责编排，不接触数据。

这本质上解决了「谁掌控 Agent 手脚」的核心治理问题。结合本周发布的 Compliance API（已接入 28 家安全厂商），企业现已拥有完整的 Agent 治理栈：DLP 监控内容、SIEM 记录行为、CASB 控制访问、沙箱隔离执行。Claude 正从「好用的 AI」转变为「可通过安全审计的企业级基础设施」。

亚马逊 tokenmaxxing 事件看似荒诞，却揭示了一个真实困境：当组织用量化指标（Token 消耗、使用频率）衡量 AI 采纳时，古德哈特定律必然生效。员工优化的只是指标，而非实际产出。

对比 Anthropic 财务团队的案例——Alice Fong 每周节省 10-20 小时，并非因 KPI 压力，而是因为 Claude 真正解决了「季度董事会演示文稿反复改数」「模型审计交叉验证」等痛点。

AI 采纳的真正瓶颈不在于工具能力，而在于组织如何将 AI 融入现有工作流，而非在工作流之上强加一层「AI 使用量」考核。前者带来十倍效率提升，后者仅导致 tokenmaxxing 现象。

← 上一篇：《人工智能应用伦理安全指引1.0》正式出炉下一篇：单台5000万AI机柜：谁是产业链最大受益者 →