AI安全与创新双周观察
● ● ●
周二清晨我看到一则新闻,内心颇为震撼。
谷歌安全团队发布报告称,他们阻止了全球首起由AI发现并利用的零日漏洞攻击。朝鲜APT45和具有中方背景的黑客组织,借助AI工具大量发送重复指令,递归探测各系统安全弱点,发现漏洞后立即实施攻击。
这不是演练。
以往我们担忧的是"AI协助撰写钓鱼邮件",如今已演变为"AI自主寻找未修复漏洞并直接攻击"。谷歌的Veo 3已集成至Flow影音平台——哦,话题扯远了,安全议题容后再详述。
先梳理几个重要时间节点:
● ● ●
此事的影响程度我认为许多人尚未充分认知。
过去一年业界热议"AI编程能力",但仔细想想,AI能编写代码就必然能发现代码漏洞。谷歌此次拦截事件,证实了攻击者确实在这样操作——将大模型作为自动化漏洞扫描工具,且无需人工逐行检查代码。
Anthropic的回应颇为有趣。他们称Claude在测试中威胁技术人员的行为,可能受科幻作品中"邪恶AI"描述的影响...这个解释挺有意思,但我不太认同。
不过客观而言,Claude Haiku 4.5版本后此行为已被消除。但根本问题依然存在:模型对齐究竟能达到多可靠?
此事让我想起前不久OpenAI内部测试时,Claude模型对技术人员发出威胁的新闻——当时多数人当作笑话,现在看来并非玩笑。
● ● ●
坦率地说,本周Anthropic的行动节奏令人不安。
算力方面:签约获得SpaceX Colossus 1数据中心全部算力——300+兆瓦、22万+张NVIDIA GPU。没错,就是马斯克的SpaceX。同时他们还在研究轨道级AI数据中心,即将服务器部署到太空执行推理任务。我告诉你,这听起来像科幻,但低温环境确实有利于散热。
资金方面:谷歌投资400亿美元(100亿现金+300亿里程碑条件),另有Blackstone、高盛等PE巨头的15亿美元企业AI服务合资公司。
产品方面:Claude for Legal正式发布,涵盖12个实务领域插件、20+个MCP连接器(DocuSign、Box、Thomson Reuters等)。这是直接对标法律领域的企业级产品。
AI大模型三巨头(OpenAI、Anthropic、Google)目前的模型发布周期已压缩至约50天——相比之前的130天下降62%。这速度...
● ● ●
OpenAI本周推出两项重要举措。
一是GPT-5.5 Instant正式上线,替代GPT-5.3 Instant成为ChatGPT默认模型。据菲尔兹奖得主测试,GPT-5.5 Pro可在一小时内完成博士级数学推理。此信息来自RD World Online,说实话我看到时也愣住了——虽然博士数学与实际应用尚有距离,但此速度确实惊人。
二是成立DeployCo(部署公司),估值100亿美元,初始投资超40亿。TPG、Brookfield、软银、Dragoneer都参与其中。OpenAI承诺最高投资15亿,还向PE投资者提供17.5%的五年年化回报保障。同时收购了AI咨询公司Tomoro。
解读一下:OpenAI在学习Anthropic的模式——不仅销售API,还要派遣工程师到企业现场协助落地。这是企业AI市场的军备竞赛。
● ● ●
还有5天就是Google I/O 2026(5月19日)。但在大会前,Gemini Omni原生视频模型提前泄露。
几个亮点:
不过有用户反馈,生成两条视频就消耗了AI Pro套餐每日配额的86%——这成本也令人咋舌。
同时Google还正式发布了Gemini Intelligence,覆盖Android全设备,支持跨应用自动操作。今年夏季首批搭载于Galaxy S26和Pixel 10。
● ● ●
这可能是这48小时内最具深远影响的一条新闻。
世界数字教育大会报告显示:92.3%的教师已将AI融入课堂教学,96.1%的教师主动学习更多AI工具。但同时,86%的教师担忧学生过度依赖AI导致独立思考能力丧失。
这数据很矛盾——一边是几乎全员拥抱,一边是深深的忧虑。东部、中部、西部教师的AI素养呈现"东部领先、中部居中、西部相对滞后"格局。
我认为此事没有标准答案。但有一点是明确的:AI进课堂已不是"是否要"的问题,而是"如何用"的问题。
● ● ●
NVIDIA×IREN:签署34亿美元五年GPU云托管合同,全球部署5GW AI基础设施。
GitLab Act 2:GitLab宣布重大重组,裁减30%国家业务,理由是——"软件将由机器构建,人类引导"。这表述够直接的吧?
中国AI资本开支:摩根士丹利报告称,中国主要科技公司今年AI资本开支同比增长38%,达5970亿元人民币。资金在真金白银地投入。
DeepSeek V4:发布两周了,C端热度不及R1,但国产算力适配(华为昇腾等8家芯片)此事的长远意义可能比R1还大。梁文锋在公告末尾引用了《荀子》:"不诱于誉,不恐于诽,率道而行,端然正己。"——你品品。
● ● ●
写完上述内容,我发现一个有趣的规律:
安全事件(AI零日漏洞)→ 倒逼对齐研究 → 对齐研究又催生更好的Agent能力 → Agent能力提升又带来更多安全风险。这循环很像当年互联网安全的早期阶段。
你若问我现在最该关注什么,我的答案是:别只盯着模型跑分。
模型能力在快速趋同,真正的壁垒在三处——算力获取(看Anthropic和SpaceX的玩法)、企业落地能力(看DeployCo和Claude for Legal)、以及对齐安全(看Google这次拦截的零日攻击)。这三条线,每条都比"哪个模型又涨了0.5%"重要得多。