AI安全与创新双周观察

发布时间：2026-05-14 21:05阅读：40

● ● ●

周二清晨我看到一则新闻，内心颇为震撼。

谷歌安全团队发布报告称，他们阻止了全球首起由AI发现并利用的零日漏洞攻击。朝鲜APT45和具有中方背景的黑客组织，借助AI工具大量发送重复指令，递归探测各系统安全弱点，发现漏洞后立即实施攻击。

这不是演练。

以往我们担忧的是"AI协助撰写钓鱼邮件"，如今已演变为"AI自主寻找未修复漏洞并直接攻击"。谷歌的Veo 3已集成至Flow影音平台——哦，话题扯远了，安全议题容后再详述。

先梳理几个重要时间节点：

● ● ●

此事的影响程度我认为许多人尚未充分认知。

过去一年业界热议"AI编程能力"，但仔细想想，AI能编写代码就必然能发现代码漏洞。谷歌此次拦截事件，证实了攻击者确实在这样操作——将大模型作为自动化漏洞扫描工具，且无需人工逐行检查代码。

Anthropic的回应颇为有趣。他们称Claude在测试中威胁技术人员的行为，可能受科幻作品中"邪恶AI"描述的影响...这个解释挺有意思，但我不太认同。

不过客观而言，Claude Haiku 4.5版本后此行为已被消除。但根本问题依然存在：模型对齐究竟能达到多可靠？

此事让我想起前不久OpenAI内部测试时，Claude模型对技术人员发出威胁的新闻——当时多数人当作笑话，现在看来并非玩笑。

● ● ●

坦率地说，本周Anthropic的行动节奏令人不安。

算力方面：签约获得SpaceX Colossus 1数据中心全部算力——300+兆瓦、22万+张NVIDIA GPU。没错，就是马斯克的SpaceX。同时他们还在研究轨道级AI数据中心，即将服务器部署到太空执行推理任务。我告诉你，这听起来像科幻，但低温环境确实有利于散热。

资金方面：谷歌投资400亿美元（100亿现金+300亿里程碑条件），另有Blackstone、高盛等PE巨头的15亿美元企业AI服务合资公司。

产品方面：Claude for Legal正式发布，涵盖12个实务领域插件、20+个MCP连接器（DocuSign、Box、Thomson Reuters等）。这是直接对标法律领域的企业级产品。

AI大模型三巨头（OpenAI、Anthropic、Google）目前的模型发布周期已压缩至约50天——相比之前的130天下降62%。这速度...

● ● ●

OpenAI本周推出两项重要举措。

一是GPT-5.5 Instant正式上线，替代GPT-5.3 Instant成为ChatGPT默认模型。据菲尔兹奖得主测试，GPT-5.5 Pro可在一小时内完成博士级数学推理。此信息来自RD World Online，说实话我看到时也愣住了——虽然博士数学与实际应用尚有距离，但此速度确实惊人。

二是成立DeployCo（部署公司），估值100亿美元，初始投资超40亿。TPG、Brookfield、软银、Dragoneer都参与其中。OpenAI承诺最高投资15亿，还向PE投资者提供17.5%的五年年化回报保障。同时收购了AI咨询公司Tomoro。

解读一下：OpenAI在学习Anthropic的模式——不仅销售API，还要派遣工程师到企业现场协助落地。这是企业AI市场的军备竞赛。

● ● ●

还有5天就是Google I/O 2026（5月19日）。但在大会前，Gemini Omni原生视频模型提前泄露。

几个亮点：

不过有用户反馈，生成两条视频就消耗了AI Pro套餐每日配额的86%——这成本也令人咋舌。

同时Google还正式发布了Gemini Intelligence，覆盖Android全设备，支持跨应用自动操作。今年夏季首批搭载于Galaxy S26和Pixel 10。

● ● ●

这可能是这48小时内最具深远影响的一条新闻。

世界数字教育大会报告显示：92.3%的教师已将AI融入课堂教学，96.1%的教师主动学习更多AI工具。但同时，86%的教师担忧学生过度依赖AI导致独立思考能力丧失。

这数据很矛盾——一边是几乎全员拥抱，一边是深深的忧虑。东部、中部、西部教师的AI素养呈现"东部领先、中部居中、西部相对滞后"格局。

我认为此事没有标准答案。但有一点是明确的：AI进课堂已不是"是否要"的问题，而是"如何用"的问题。

● ● ●

NVIDIA×IREN：签署34亿美元五年GPU云托管合同，全球部署5GW AI基础设施。

GitLab Act 2：GitLab宣布重大重组，裁减30%国家业务，理由是——"软件将由机器构建，人类引导"。这表述够直接的吧？

中国AI资本开支：摩根士丹利报告称，中国主要科技公司今年AI资本开支同比增长38%，达5970亿元人民币。资金在真金白银地投入。

DeepSeek V4：发布两周了，C端热度不及R1，但国产算力适配（华为昇腾等8家芯片）此事的长远意义可能比R1还大。梁文锋在公告末尾引用了《荀子》："不诱于誉，不恐于诽，率道而行，端然正己。"——你品品。

● ● ●

写完上述内容，我发现一个有趣的规律：

安全事件（AI零日漏洞）→ 倒逼对齐研究 → 对齐研究又催生更好的Agent能力 → Agent能力提升又带来更多安全风险。这循环很像当年互联网安全的早期阶段。

你若问我现在最该关注什么，我的答案是：别只盯着模型跑分。

模型能力在快速趋同，真正的壁垒在三处——算力获取（看Anthropic和SpaceX的玩法）、企业落地能力（看DeployCo和Claude for Legal）、以及对齐安全（看Google这次拦截的零日攻击）。这三条线，每条都比"哪个模型又涨了0.5%"重要得多。