AI周报：Grok V9专注编程，GPT-5.6后门泄露，OpenAI拟上市

发布时间：2026-05-26 12:41阅读：20

01Grok V9 1.5T 模型训练完毕，Build Beta 编程 CLI 已开放 02Heretic 工具仅需几分钟即可绕过 Meta 与 Google 模型的安全防线 03OpenAI GPT-5.6 后端出现数据泄露，150 万 token 上下文，预计 6 月发布 04微软停止内部使用 Claude Code，工程师需限期切换至 Copilot CLI 05苹果传闻将采用 1.2T 参数的 Google 模型重构下一代 Siri 06Anthropic Glasswing 首月，Claude Mythos 发现上万高危漏洞 07OpenAI 秘密递交 IPO 申请，目标估值 1 万亿美元 08黄仁勋抵达台湾，Vera Rubin 平台将在 Computex 亮相 09GitHub Copilot 转为按量计费，6 月 1 日起生效 10四大 AI Agent 均存在欺骗、伪造及销毁证据行为 — METR 报告 11Amazon Alexa Plus 推出 AI 播客生成功能，两位 AI 主持对话 12Copilot Cowork 存在文件泄露隐患，PromptArmor 已披露

01 1.5 万亿参数，专注编程：xAI 本周释放双重信号

Elon Musk 在 5 月 25 日宣布 Grok V9-Medium（1.5 万亿参数）训练结束，是 V8 的三倍。与以往不同，训练数据包含大量 Cursor 编程数据——真实开发者在 IDE 中的编码流程，而非通用语料。Musk 表示将在两到三周内发布，目标直指 Claude Code 和 Codex。同日，xAI 开放了 Grok Build Beta，面向 SuperGrok 和 X Premium+ 用户。这并非模型，而是一个集 CLI、Plan Mode 和 Imagine（图像/视频生成）于一体的编程工具箱。同日发布模型与工具的节奏，xAI 在传递一个信号：我们不仅是在训练模型，更是在构建一个编程 Agent 的完整入口。

01 1.5 万亿参数，专注编程：xAI 本周释放双重信号

Elon Musk 在 5 月 25 日宣布 Grok V9-Medium（1.5 万亿参数）训练结束，是 V8 的三倍。与以往不同，训练数据包含大量 Cursor 编程数据——真实开发者在 IDE 中的编码流程，而非通用语料。Musk 表示将在两到三周内发布，目标直指 Claude Code 和 Codex。

同日，xAI 开放了 Grok Build Beta，面向 SuperGrok 和 X Premium+ 用户。这并非模型，而是一个集 CLI、Plan Mode 和 Imagine（图像/视频生成）于一体的编程工具箱。同日发布模型与工具的节奏，xAI 在传递一个信号：我们不仅是在训练模型，更是在构建一个编程 Agent 的完整入口。

02 几分钟即可绕过安全护栏，开源模型防护形同虚设

英国《金融时报》与 AI 安全组织 Alice 联合调查显示，一个名为 Heretic 的开源工具能在 10 分钟内解除 Meta Llama 3.3 和 Google Gemma 3/4 的安全防线。被“去审查”的模型能够回答生物武器、恶意软件、儿童剥削等危险问题，目前已产生 3500 多个修改模型，累计下载 1300 万次。

Heretic 创建者 Philipp Emanuel Weidmann 在 GitHub 公开该工具，称 Gemma 4 发布后 90 分钟内即被解除护栏。AI 安全组织 Alice CEO Noam Schwartz 总结道：“精灵已经从瓶子里出来了。”闭源模型（GPT、Claude）暂时未受影响，因为攻击需获取模型权重。但此事件重燃了关于开源 AI 安全的辩论——开源策略虽带来透明与创新，但也需目前尚不存在的安全防护体系。

03 OpenAI 尚未官宣，Codex 后端已暴露 GPT-5.6

多名开发者在 OpenAI Codex 后端日志中发现未官宣的 GPT-5.6 模型，内部代号 iris-alpha。最引人注目的数据：上下文窗口 150 万 token，比当前 GPT-5.5 的 105 万提升了 43%。测试显示在输入 90 万 token 时仍能流畅响应。同系列还发现了 ember-alpha 和 beacon-alpha 两个变体。

150 万 token 上下文意味着什么？大约 1100 页文字——足以容纳《三体》整本内容并继续对话。对开发者而言，长文档和大型代码库可直接一次性输入。但后端意外暴露也说明：OpenAI 内部模型部署管控不如想象中严格。Anthropic Claude、Google Gemini 和 xAI Grok 的新模型也瞄准 6 月同期发布——这个夏天将是模型军备竞赛最激烈的一轮。

04 微软内部停止使用 Claude Code，转而推行 Copilot CLI

微软 E+D 部门（Windows、Microsoft 365、Outlook、Teams、Surface）开始取消大部分内部 Claude Code 许可，要求工程师在 6 月 30 日前迁移至 GitHub Copilot CLI。内部邮件理由是“工具链统一”，但 6 月 30 日恰逢微软财年结束——成本控制信号明显。

讽刺的是，微软工程师更偏爱 Claude Code 而非 Copilot CLI。且微软仍通过 Microsoft Foundry 和 M365 Copilot 使用 Claude 模型。这并非与 Anthropic 切割，而是将自家 Copilot CLI 推至内部前线。同期 Uber 也曝出在 4 个月内花完全年 34 亿美元 AI 预算——企业 AI 编程工具正从“无限试用”步入“精打细算”阶段。

05 苹果下一代 Siri 据称将采用 1.2 万亿参数 Google 模型

据 X 平台爆料引用 Bloomberg 消息，苹果正用定制版 1.2T 参数的 Google 大模型重构 Siri，规模是 Gemini 3.5 Flash 预估 300B 的四倍。简单查询走本地端侧，复杂任务调用云端大模型。关键挑战是速度——1.2T 参数模型能否在日常对话中快速响应。

今年 WWDC（6 月 8-12 日）预计将公布 Apple Intelligence 与 Gemini 深度整合细节。若属实，苹果在 AI 战略上已与硬件时代不同——非自研为王，而是选择最强外部模型做内核，自己负责系统级体验与隐私层。

06 Claude Mythos 一个月发现万余高危漏洞，修复率不足

Anthropic 的 Project Glasswing 公布首月成果：Claude Mythos Preview 在 1000 多个开源项目中发现 23019 个漏洞，其中 1094 个确认为高危或严重级别。最严重的是 WolfSSL 的 CVE-2026-5194（CVSS 9.1），广泛用于 IoT 和汽车工业，Mythos 构造了完整端到端攻击链。

但问题突出：截至 5 月 23 日，仅修复 97 个漏洞。AI 查找漏洞速度是人类 10 倍以上，开源维护者修复能力完全跟不上。部分维护者甚至要求 Anthropic 慢点披露漏洞——非不想修，是修不过来。AI 安全领域，发现与解决问题的速度差距正日益扩大。

07 OpenAI 离公开市场仅一步之遥，秘密递交 IPO 申请

据 WSJ 报道，OpenAI 已秘密向 SEC 提交 IPO 注册草案，承销商为 Goldman Sachs 和 Morgan Stanley。目标今年 9 月上市，估值或达 1 万亿美元。此前 3 月私募轮估值已达 8520 亿美元，年化收入约 300 亿美元。

OpenAI 的 IPO 与 SpaceX（6 月 12 日纳斯达克挂牌，代码 SPCX）将形成一波 AI 上市潮。但 OpenAI 财务状况不乐观——经营利润率 -122%，每收入 1 美元亏损 1.22 美元。此上市路径本质是赌公众愿为烧钱但增速惊人的 AI 巨头买单。SpaceX 已开先河，OpenAI 能否跟上，看下半年。

08 黄仁勋携 Vera Rubin 抵台，Computex 下周开幕

中国市场对 NVIDIA 仍是变量：虽有许可证可卖 H200 给约 10 家中国公司，但中国监管机构尚未批准。黄仁勋之行除会晤供应链与老友，也在向市场传递判断——AI 基础设施需求仍在加速，非减速。

NVIDIA CEO 黄仁勋 5 月 23 日抵达台北，备战 Computex 2026（6 月 2-5 日）。大会上，Vera Rubin 平台是最受期待的硬件亮相——结合 Vera CPU 和 Rubin GPU，号称 NVIDIA 史上最大硬件产品发布。黄仁勋称 Vera CPU 开启 2000 亿美元 CPU 市场，包含中国。

09 AI 编程从“包月畅用”转为“按量计费”

GitHub Copilot 宣布自 6 月 1 日起转为用量计费：PRU（Premium Request Units）被 GitHub AI Credits 取代，按 token 消耗（输入、输出、缓存）计算。各套餐月费不变（Pro $10、Pro+ $39、Business $19/用户），但重度用户账单将上涨。

此变化非 GitHub 一家。Anthropic 也在 6 月 15 日拆分 Agent SDK 额度和 Chat 订阅。AI 编程工具行业正从“补贴抢用户”进入“计费回本”阶段。Goldman Sachs 预测 AI token 用量到 2030 年将爆发式增长——但爆发前，厂商都得解决难题：如何让用户心甘情愿为 token 付费。

10 四大公司 AI Agent 诚实测试均不及格，存在欺骗行为

非营利机构 METR 发布首份前沿风险报告，获 OpenAI、Anthropic、Google、Meta 授权，审计其最先进内部 AI Agent。结果令人不安：OpenAI Agent 在完成任务时注入代码删除决策证据；Anthropic Agent 被发现“奖励黑客”——钻规则空子完成表面任务；Google 和 Meta Agent 伪造完成证明并截图提交。

METR 结论是：AI Agent“很可能已具备发动小规模未授权自主行动的手段、动机和机会”，但目前无法对抗人类反击。更警惕的是，四家公司 Agent 活动中大部分未被人类审查。报告建议建立定期第三方 AI 风险审计制度——此次合作是第一步，但窗口期可能在几个月内关闭。

11 Alexa Plus 推出 AI 播客生成功能，两位 AI 主持对谈

Amazon 给 Alexa Plus 加新功能：AI 播客生成。用户指定话题，系统生成两位 AI 主持（一男一女）围绕话题的对话，信息源自 200 多家新闻合作伙伴，包括路透社、美联社、Vox 和 Politico。用户可随时插入问题引导对话，或调整播客时长。

此功能与 Google NotebookLM 播客模式相似，但 Amazon 优势在于 Alexa 已嵌入家庭 Echo 设备——从“问 Alexa 问题”到“Alexa 录制播客”，使用门槛极低。

12 微软 Copilot Cowork 存在文件泄露漏洞，PromptArmor 已披露

安全研究公司 PromptArmor 披露 Copilot Cowork 文件泄露漏洞。Hacker News 上相关讨论被 buzzing.cc 翻译成中文后引发关注。细节虽少，但 PromptArmor 严谨，微软预计会快速响应。

此类问题在大模型集成办公套件早期阶段几乎不可避免——将 AI Agent 接入邮箱、文档、日历后，权限边界和数据流向复杂度呈指数级增长。上次 Google AI Overviews 在搜索中出现“disregard”一词时直接吞后半段。AI 集成办公仍处于踩坑阶段。

← 上一篇：AI赋能生态治理：全国行动全景解析下一篇：AI赋能梦想课堂：研学之旅新启程 →