标签

AI日报|Opus 4.8称霸编程界,Mistral转型全栈挑战OpenAI,微软自研模型反击Claude Code

发布时间:2026-06-01 13:09来源:微信阅读:5

01Opus 4.8封王编程,41天一代 02Mistral变阵全栈,拉空客宝马 03微软自研编程,先砍Claude Code 04NVIDIA N1X让PC换Arm心 05Anthropic $650亿逼近万亿 06Snowflake AI涨34%锁AWS 07Siri跑Gemini了,WWDC倒计时 08AWS重写搜索,Agent流量逼的 09孙正义€750亿欧洲建算力集群 10GREYVIBE用ChatGPT发动攻击 11DynoSim把部署试错快1500倍 12Claude Code日增300星霸榜 13Google和DeepMind分歧公开化 14空客签Mistral五年,工业AI进产线 15AWS用AI做SRE,宕机前预测 16Snowflake AI破亿,五千客户 17WWDC一周倒计,14篇AI论文铺路 18微软Copilot超级应用今夏上线 19Mistral自建数据中心推AI主权 20DeepMind VP说下战是信任不是分

01Opus 4.8封王编程,41天一代

02Mistral变阵全栈,拉空客宝马

03微软自研编程,先砍Claude Code

04NVIDIA N1X让PC换Arm心

05Anthropic $650亿逼近万亿

06Snowflake AI涨34%锁AWS

07Siri跑Gemini了,WWDC倒计时

08AWS重写搜索,Agent流量逼的

09孙正义€750亿欧洲建算力集群

10GREYVIBE用ChatGPT发动攻击

11DynoSim把部署试错快1500倍

12Claude Code日增300星霸榜

13Google和DeepMind分歧公开化

14空客签Mistral五年,工业AI进产线

15AWS用AI做SRE,宕机前预测

16Snowflake AI破亿,五千客户

17WWDC一周倒计,14篇AI论文铺路

18微软Copilot超级应用今夏上线

19Mistral自建数据中心推AI主权

20DeepMind VP说下战是信任不是分

01 Claude Opus 4.8 发布,41天迭代一代,编程和诚实度双杀

01 Claude Opus 4.8 发布,41天迭代一代,编程和诚实度双杀

Anthropic的发布节奏已经快到按周算了。Opus 4.7发布了41天,Opus 4.8就到了。

三件事值得单拎出来说:

第一,Dynamic Workflows。Claude现在可以自己把大任务拆成几十上百个并行子任务。Anthropic展示了一个案例:把75万行Zig代码迁到Rust,跑了11天,测试通过率99.8%。这不是辅助编程,是让AI当架构师。

第二,诚实度。Opus 4.8在有缺陷数据任务上的误报率是0%——宁愿拒绝回答也不编造。错误命令行建议比4.7少了10倍。在一个所有模型都在卷分数的时代,这个指标比SWE-Bench更值钱。

第三,价格。Fast Mode比4.7便宜了3倍——$10/$50每百万Token。标准模式$5/$25。降价和提能力同时在发生。

SWE-Bench Pro 69.2%,OSWorld 83.4%,USAMO数学96.7%——编程和计算机使用两个维度都超过了GPT-5.5。

02 Mistral巴黎峰会变阵,从模型商变成全栈平台

02 Mistral巴黎峰会变阵,从模型商变成全栈平台

Mistral在巴黎卢浮宫办了第一届AI NOW峰会,信息量极大。核心一句话:不做模型商了,做全栈平台。

Le Chat改名Vibe,变成一个统一Agent平台。Vibe for Work可以连Google Workspace、Outlook、Slack、GitHub,做多步企业任务。Vibe for Code是编程Agent,Web+VS Code+CLI三端通吃。定价免费版、Pro $14.99/月、Teams $24.99/用户/月。年收入目标€10亿,去年才€2亿。

最值得关注的是工业AI——Mistral收购了Emmi AI,把物理仿真能力整合进AI。空客签了5年长约,覆盖商业飞机、直升机、国防和太空。宝马在用Mistral做碰撞仿真。

图源:Mistral

03 微软下周发自有编程模型,内部先禁了Claude Code

03 微软下周发自有编程模型,内部先禁了Claude Code

Build 2026下周开幕,微软要发布自研编程模型,专门给GitHub Copilot用。目标很明确——减少对OpenAI和Anthropic的依赖。

同一时间,微软内部的Experiences and Devices部门被要求在6月30日前停用Claude Code,全转到Copilot CLI。原因只有一个字:贵。Token账单跑得太快了。

一边自研模型补齐能力,一边砍掉第三方的账单。微软的AI策略正在从「买最好的模型」变成「用自己的模型省钱」。

04 NVIDIA + 微软 + Arm 预告「PC新时代」

04 NVIDIA + 微软 + Arm 预告「PC新时代」

三家在X上发了一条只有一个坐标的帖子——台北Computex会场。配文:A new era of PC。

这个「新时代」指的是N1X——NVIDIA和联发科联合开发的Arm架构AI PC芯片。约20个ARM核心+Blackwell GPU,最高6144个CUDA核心,算力接近RTX 5070。Dell、联想、华硕都在准备对应的设备,预计年底上市。

Wintel体系——微软Windows+Intel x86——这个统治PC行业三十年的组合,正在被撬开一个口子。

05 Anthropic $650亿单轮融资,估值$9650亿

05 Anthropic $650亿单轮融资,估值$9650亿

Anthropic完成了$650亿Series H,估值$9650亿。这是有史以来最大的单轮融资。加上之前几轮,Anthropic累计融资超过$1000亿。

有趣的是,Anthropic收入增速比OpenAI快,但计算开支只有OpenAI的四分之一。Opus 4.8在多个基准上超过GPT-5.5,定价却更便宜。投资人赌的是效率优势最终会变成市场份额。

OpenAI也在准备$1万亿IPO,预计9月上市。两家公司在同一个赛道,但走了完全不同的路——OpenAI选公开市场,Anthropic继续私募。

06 Snowflake Q1 AI收入暴涨34%,$60亿锁定AWS到2032

06 Snowflake Q1 AI收入暴涨34%,$60亿锁定AWS到2032

Snowflake Q1产品收入$13.3亿,涨了34%。AI产品线——Cortex AI、Cortex Agents、Document AI——年化收入破$1亿。5200多个客户每周在用AI/ML功能,13600多个账户在使用Snowflake AI。

同一天宣布了一个大单:$60亿锁定AWS到2032年,深度集成Amazon Bedrock和AWS Graviton处理器。AWS CEO说企业在「从实验AI转向把智能Agent投入生产」。Snowflake股价盘后涨了30%以上。

07 Apple Siri换脑,Gemini要在iPhone里跑了

07 Apple Siri换脑,Gemini要在iPhone里跑了

Bloomberg的Mark Gurman泄露了iOS 27的Siri新界面——住在Dynamic Island里的专用Siri app,聊天式界面,跨应用操作,对话历史30天或1年自动删除。

底层不再是苹果自研模型,是Google Gemini。苹果签了多年协议,正在尝试把Gemini蒸馏成能在iPhone上跑的尺寸。M5芯片可以在3秒内跑完300亿参数模型——但Gemini是万亿级的。

WWDC 6月8日开幕。苹果同时在CVPR投了14篇AI论文。Siri这根最粗的AI管线,终于要换了。

08 AWS把搜索服务拆了重做,因为Agent的流量和人不一样

08 AWS把搜索服务拆了重做,因为Agent的流量和人不一样

AWS发布了新一代OpenSearch Serverless,专门为AI Agent的流量模式重新设计。关键词:计算和存储分离。

普通用户搜东西,流量是间歇性的。Agent搜东西,可能瞬间几百个请求同时打过来,然后又归零。旧的搜索引擎架构扛不住这种脉冲式流量。新架构按需启动计算,Agent安静时资源降到零。

Amazon Bedrock的年化AI收入已经超过$150亿。AWS同期的资本支出也创了纪录——回报要等到2027-2028年。

09 孙正义砸€750亿在法国建欧洲最大AI算力集群

09 孙正义砸€750亿在法国建欧洲最大AI算力集群

SoftBank宣布在法国北部投资€750亿(约$875亿),建3.1GW的数据中心容量,远期目标是5GW。选址在敦刻尔克和周边两个城市,施耐德电气参与工程。

这个规模相当于把法国全国的云计算能力翻了一倍不止。欧洲一直在AI基建上落后于美国和中国,孙正义这笔钱是一次「算力马歇尔计划」。

对SoftBank来说,投的是欧洲AI市场的入场券——谁掌握了算力,谁就掌握了未来十年的AI定价权。

10 GREYVIBE黑客组织用ChatGPT和Gemini发动国家级攻击

10 GREYVIBE黑客组织用ChatGPT和Gemini发动国家级攻击

安全公司披露了一个叫GREYVIBE的俄罗斯黑客组织,正在系统性地用ChatGPT和Google Gemini来发动网络攻击——从生成钓鱼邮件到编写恶意代码,再到分析目标网络拓扑。

这不是传统的「黑客用AI」。这是AI模型被当作攻击基础设施在用。对于OpenAI和Google来说,安全不再只是防越狱——模型本身就是武器。

也是为什么OpenAI同一周推出了选举安全措施和Rosalind Biodefense:不是AI公司在做慈善,是对手和监管都在看着。

11 NVIDIA DynoSim加速1500倍,MCG一分钟搞定AI合规文档

11 NVIDIA DynoSim加速1500倍,MCG一分钟搞定AI合规文档

NVIDIA发了两个工具。DynoSim是一个LLM部署模拟器,能在几分钟内画出一个模型在不同GPU配置下的最优部署方案——以前这需要几天的实测。速度比实时快了1500倍。

MCG Toolkit自动生成AI模型文档——输入模型参数,一分钟输出符合加州AB-2013和欧盟AI Act的Model Card。法规合规从「雇律师写一个月」变成了「点一下按钮」。两个工具瞄准同一个痛点:AI从实验到生产的最后一公里。

12 Claude Code还在日增300星,编程Agent的竞争按周在迭代

12 Claude Code还在日增300星,编程Agent的竞争按周在迭代

GitHub Trending上Claude Code还在以每天约300星的速度涨。Opus 4.8的Dynamic Workflows让它从一个编程助手变成了一个能管几十个并行子任务的Agent编排器。

Grok Build 0.1、Cursor Composer 2.5、Mistral Vibe for Code——编程Agent这个赛道一周内挤进了三个新玩家。但Claude Code有两个对手没有的东西:上百个版本的工程积累和Opus 4.8的诚实度。

编程这件事从「人写代码AI补全」到「人说需求AI全包」,过渡比所有人预期的都快。

13 Google和DeepMind的战略分歧浮出水面

13 Google和DeepMind的战略分歧浮出水面

Google和DeepMind之间正在出现路线分歧。Google要的是实用——成本低、跑得快、能在TPU 8i上部署的模型。DeepMind要的是AGI——原生多模态、世界模型、Gemini Omni那个方向。

Gemini Omni的Flash版本先于完整版发布,就是一个妥协的结果。Google让DeepMind先把「能用的」交出来,AGI的事往后放。这种张力不是坏事。但一家公司同时跑两条路,资源分配迟早要打架。

14 空客签了Mistral五年长约,工业AI从仿真渗透到生产

14 空客签了Mistral五年长约,工业AI从仿真渗透到生产

Mistral在巴黎峰会上宣布空客签了5年合作,覆盖商业飞机、直升机、国防和太空四个部门。宝马也在用Mistral做碰撞仿真——以前跑一次要几小时,现在几分钟。

关键不是AI能生成设计图。关键是把物理仿真引擎和LLM整合在一起——AI不只是「画了一个机翼」,是「算出了这个机翼在超音速下的应力分布」。工业AI的壁垒不在语言模型,在物理精度。

15 AWS Resilience Hub用AI做SRE,宕机前就预测到问题

15 AWS Resilience Hub用AI做SRE,宕机前就预测到问题

AWS把生成式AI整合进了Resilience Hub,让AI来做站点可靠性工程。以前SRE靠监控面板和经验判断什么时候可能出问题。现在是AI主动检测异常、推荐修复方案,甚至根据应用类型和风险等级自动生成恢复计划。

这个方向比模型基准有意思:AI在做一件对人类来说极难的事——在几百万个信号里找到那一个异常。

16 Snowflake AI产品年化破$1亿,企业数据仓库在AI化

16 Snowflake AI产品年化破$1亿,企业数据仓库在AI化

Snowflake的AI产品线——Cortex AI、Cortex Agents、Document AI——年化收入破了$1亿。5200多个客户每周在用AI/ML功能。

和Databricks的竞争也在升级。Databricks同一天推出了Model Units——一个LLM推理的抽象层,声称能省80%的GPU成本,每月处理120万亿Token。两家的AI路线不同:Snowflake从数据仓库往上建AI,Databricks从数据工程往外拓推理。

17 Apple WWDC倒计时一周,14篇AI论文铺路

17 Apple WWDC倒计时一周,14篇AI论文铺路

WWDC 2026 6月8日开幕,Apple在CVPR投了14篇AI论文。从LLM图像生成、多模态推理的空间功能智能,到实时视频流模型和可访问性AI。

还有一个信号:Apple正在评估收购LiquidAI——一家专做端侧模型优化的创业公司。iOS 27的Siri要跑Gemini,但Apple显然不想永远靠Google。端侧AI模型才是Apple的终极答案。

18 微软Copilot超级应用计划曝光,编程聊天Agent全打通

18 微软Copilot超级应用计划曝光,编程聊天Agent全打通

微软在Build 2026前泄露了一个代号「Delivering one Copilot」的超级应用计划:把GitHub Copilot、Copilot Chat、Copilot Cowork和一个叫Autopilot的新Agent功能全打通,做成一个统一的入口。

负责这个项目的是新上任的Copilot负责人Jacob Andreou。目标是今年夏天上线。同一时间微软AI业务年化收入$370亿,涨了123%。但资本支出也破了$400亿——建数据中心的速度跟不上AI需求的增长。

19 Mistral自建10MW数据中心,欧洲AI主权路线图

19 Mistral自建10MW数据中心,欧洲AI主权路线图

Mistral在NOW峰会上宣布了一个€40亿的基础设施计划:200MW到2027年,1GW到2030年。第一座10MW推理数据中心今年Q3在巴黎南郊启用,瑞典还有一个站点准备跑NVIDIA下一代Vera Rubin GPU。

Mistral CEO Arthur Mensch在法国议会说过:欧洲大概有两年时间建足够的基础设施,否则会变成美国云计算巨头的「附庸国」。10MW不算大。但意义不在规模——在于欧洲终于有AI公司在自己建基础设施了。

20 DeepMind产品VP说AI下一阶段取决于信任不是基准分

20 DeepMind产品VP说AI下一阶段取决于信任不是基准分

Google DeepMind产品VP Tulsee Doshi在Fast Company采访里说了一段话:AI下一阶段的瓶颈不是模型能力,是用户信任。

她说Agent有三个问题还没解决:谄媚(sycophancy)、安全护栏、以及用户怎么验证AI做对了。Google能做的是同时服务2B企业客户和她妈这样的普通用户——但前提是两个群体都信任这个系统。

这句话放在Opus 4.8把「诚实度」当核心卖点的同一周,不是巧合。AI行业正在从「能做什么」切换到「做对了没有」。