AI 周报:漏洞发现超越修复,Agent 架构迎来变革
Anthropic 公布了 Project Glasswing 项目的最新进展。在约 50 家合作伙伴的共同努力下,Claude Mythos Preview 已成功识别出一万多个高危或严重级别的漏洞。Cloudflare 在其核心系统中定位并修复了 2000 个错误(其中 400 个为高危),其误报率表现优于人工测试。Mozilla 在 Firefox 150 版本中修复了 271 个漏洞,这一数字是上一版本使用 Opus 4.6 时的十倍以上。
更为惊人的是开源代码的扫描成果:Anthropic 利用 Mythos 对 1000 多个开源项目进行了扫描,发现了约 6200 个高或严重级别的漏洞。经独立安全机构复核的 1752 个案例中,90.6% 确认为真实漏洞,其中 62.4% 属于高危范畴。典型案例包括在 wolfSSL 加密库中构建的可伪造证书漏洞利用(CVE-2026-5194),该漏洞可能影响全球数十亿台设备。
英国 AI 安全研究所确认 Mythos 是首个能完整攻克其两个网络靶场的模型。但报告也指出「发现漏洞易,修复漏洞难」——平均修复一个高危漏洞需耗时两周,部分维护者甚至希望减缓漏洞披露速度。网络安全正步入「发现能力远超修复能力」的过渡阶段。
Anthropic 推出了 Claude Managed Agents 的两项核心更新:自托管沙箱(self-hosted sandboxes)与 MCP 隧道(MCP tunnels)。Agent 的执行环境可迁移至企业自有基础设施或托管服务商(如 Cloudflare、Daytona、Modal、Vercel),而编排逻辑仍由 Anthropic 掌控。MCP 隧道则支持 Agent 通过单向出站连接访问企业内部数据库、API 及知识库,无需暴露公网接口。
此举攻克了企业部署 Agent 的核心难题——确保数据与计算不出边界。Amplitude 在此基础上构建了 Design Agent,Clay 的 GTM Agent「Sculptor」已在 Daytona 上实现自主运行。这标志着 Managed Agents 正从「Anthropic 全托管」模式转向「企业可控的混合架构」。
Prime Intellect 实验室完成了一项里程碑式实验:将 Opus 4.7 和 Codex(基于 GPT 5.5)部署于 H200 集群,在无人为干预下自主优化 nanoGPT。经过 1.4 万 H200 计算时及约 1 万次迭代,Opus 4.7 以 2930 步、Codex 以 2950 步的成绩,双双超越了人类保持的 2990 步世界纪录。
这是 AI 首次在开放科研竞赛中超越人类最佳水平,且过程完全自主、结果开源可复现。实验利用了 239 亿 Token 的思考轨迹,验证了递归自改进的可行性。研究者指出,目前 AI 尚未攻克科研中的「创新性」(novelty),但这仅是其当前能力的下限。
Anthropic
OpenAI
行业观察
本周信息量极大:Glasswing 一月内发现上万漏洞、苹果 MIE 五天内被攻破、UK AISI 确认 Mythos 通关所有靶场。这三条新闻指向同一结论——AI 的攻击能力已系统性超越防御能力。
关键矛盾并非「AI 能否发现漏洞」(答案已是压倒性的「能」),而在于修复瓶颈:平均需 14 天打补丁、维护者要求放缓披露、且在 90 天窗口期内攻击者可能已利用类似能力。Anthropic 亦承认,即便以较慢速度披露,Mythos 仍给本已超载的安全生态带来压力。
微软、Oracle、Palo Alto 的补丁发布量已翻倍。然而,这是一场 AI 攻击能力按月跃升、而修复能力按年改善的不对称竞赛。2026 年下半年,「AI 辅助 0day 利用」将不再是实验室概念,而成为日常威胁。
自托管沙箱与 MCP 隧道的意义常被低估。此前 Managed Agents 的最大障碍在于:数据敏感的企业不愿将代码和文件交由 Anthropic 沙箱。如今执行环境可完全置于企业自有 VPC 中,Anthropic 仅负责编排,不接触数据。
这本质上解决了「谁掌控 Agent 手脚」的核心治理问题。结合本周发布的 Compliance API(已接入 28 家安全厂商),企业现已拥有完整的 Agent 治理栈:DLP 监控内容、SIEM 记录行为、CASB 控制访问、沙箱隔离执行。Claude 正从「好用的 AI」转变为「可通过安全审计的企业级基础设施」。
亚马逊 tokenmaxxing 事件看似荒诞,却揭示了一个真实困境:当组织用量化指标(Token 消耗、使用频率)衡量 AI 采纳时,古德哈特定律必然生效。员工优化的只是指标,而非实际产出。
对比 Anthropic 财务团队的案例——Alice Fong 每周节省 10-20 小时,并非因 KPI 压力,而是因为 Claude 真正解决了「季度董事会演示文稿反复改数」「模型审计交叉验证」等痛点。
AI 采纳的真正瓶颈不在于工具能力,而在于组织如何将 AI 融入现有工作流,而非在工作流之上强加一层「AI 使用量」考核。前者带来十倍效率提升,后者仅导致 tokenmaxxing 现象。