AI日报|Opus 4.8称霸编程界,Mistral转型全栈挑战OpenAI,微软自研模型反击Claude Code
01Opus 4.8封王编程,41天一代 02Mistral变阵全栈,拉空客宝马 03微软自研编程,先砍Claude Code 04NVIDIA N1X让PC换Arm心 05Anthropic $650亿逼近万亿 06Snowflake AI涨34%锁AWS 07Siri跑Gemini了,WWDC倒计时 08AWS重写搜索,Agent流量逼的 09孙正义€750亿欧洲建算力集群 10GREYVIBE用ChatGPT发动攻击 11DynoSim把部署试错快1500倍 12Claude Code日增300星霸榜 13Google和DeepMind分歧公开化 14空客签Mistral五年,工业AI进产线 15AWS用AI做SRE,宕机前预测 16Snowflake AI破亿,五千客户 17WWDC一周倒计,14篇AI论文铺路 18微软Copilot超级应用今夏上线 19Mistral自建数据中心推AI主权 20DeepMind VP说下战是信任不是分
01Opus 4.8封王编程,41天一代
02Mistral变阵全栈,拉空客宝马
03微软自研编程,先砍Claude Code
04NVIDIA N1X让PC换Arm心
05Anthropic $650亿逼近万亿
06Snowflake AI涨34%锁AWS
07Siri跑Gemini了,WWDC倒计时
08AWS重写搜索,Agent流量逼的
09孙正义€750亿欧洲建算力集群
10GREYVIBE用ChatGPT发动攻击
11DynoSim把部署试错快1500倍
12Claude Code日增300星霸榜
13Google和DeepMind分歧公开化
14空客签Mistral五年,工业AI进产线
15AWS用AI做SRE,宕机前预测
16Snowflake AI破亿,五千客户
17WWDC一周倒计,14篇AI论文铺路
18微软Copilot超级应用今夏上线
19Mistral自建数据中心推AI主权
20DeepMind VP说下战是信任不是分
01 Claude Opus 4.8 发布,41天迭代一代,编程和诚实度双杀
01 Claude Opus 4.8 发布,41天迭代一代,编程和诚实度双杀
Anthropic的发布节奏已经快到按周算了。Opus 4.7发布了41天,Opus 4.8就到了。
三件事值得单拎出来说:
第一,Dynamic Workflows。Claude现在可以自己把大任务拆成几十上百个并行子任务。Anthropic展示了一个案例:把75万行Zig代码迁到Rust,跑了11天,测试通过率99.8%。这不是辅助编程,是让AI当架构师。
第二,诚实度。Opus 4.8在有缺陷数据任务上的误报率是0%——宁愿拒绝回答也不编造。错误命令行建议比4.7少了10倍。在一个所有模型都在卷分数的时代,这个指标比SWE-Bench更值钱。
第三,价格。Fast Mode比4.7便宜了3倍——$10/$50每百万Token。标准模式$5/$25。降价和提能力同时在发生。
SWE-Bench Pro 69.2%,OSWorld 83.4%,USAMO数学96.7%——编程和计算机使用两个维度都超过了GPT-5.5。
02 Mistral巴黎峰会变阵,从模型商变成全栈平台
02 Mistral巴黎峰会变阵,从模型商变成全栈平台
Mistral在巴黎卢浮宫办了第一届AI NOW峰会,信息量极大。核心一句话:不做模型商了,做全栈平台。
Le Chat改名Vibe,变成一个统一Agent平台。Vibe for Work可以连Google Workspace、Outlook、Slack、GitHub,做多步企业任务。Vibe for Code是编程Agent,Web+VS Code+CLI三端通吃。定价免费版、Pro $14.99/月、Teams $24.99/用户/月。年收入目标€10亿,去年才€2亿。
最值得关注的是工业AI——Mistral收购了Emmi AI,把物理仿真能力整合进AI。空客签了5年长约,覆盖商业飞机、直升机、国防和太空。宝马在用Mistral做碰撞仿真。
图源:Mistral
03 微软下周发自有编程模型,内部先禁了Claude Code
03 微软下周发自有编程模型,内部先禁了Claude Code
Build 2026下周开幕,微软要发布自研编程模型,专门给GitHub Copilot用。目标很明确——减少对OpenAI和Anthropic的依赖。
同一时间,微软内部的Experiences and Devices部门被要求在6月30日前停用Claude Code,全转到Copilot CLI。原因只有一个字:贵。Token账单跑得太快了。
一边自研模型补齐能力,一边砍掉第三方的账单。微软的AI策略正在从「买最好的模型」变成「用自己的模型省钱」。
04 NVIDIA + 微软 + Arm 预告「PC新时代」
04 NVIDIA + 微软 + Arm 预告「PC新时代」
三家在X上发了一条只有一个坐标的帖子——台北Computex会场。配文:A new era of PC。
这个「新时代」指的是N1X——NVIDIA和联发科联合开发的Arm架构AI PC芯片。约20个ARM核心+Blackwell GPU,最高6144个CUDA核心,算力接近RTX 5070。Dell、联想、华硕都在准备对应的设备,预计年底上市。
Wintel体系——微软Windows+Intel x86——这个统治PC行业三十年的组合,正在被撬开一个口子。
05 Anthropic $650亿单轮融资,估值$9650亿
05 Anthropic $650亿单轮融资,估值$9650亿
Anthropic完成了$650亿Series H,估值$9650亿。这是有史以来最大的单轮融资。加上之前几轮,Anthropic累计融资超过$1000亿。
有趣的是,Anthropic收入增速比OpenAI快,但计算开支只有OpenAI的四分之一。Opus 4.8在多个基准上超过GPT-5.5,定价却更便宜。投资人赌的是效率优势最终会变成市场份额。
OpenAI也在准备$1万亿IPO,预计9月上市。两家公司在同一个赛道,但走了完全不同的路——OpenAI选公开市场,Anthropic继续私募。
06 Snowflake Q1 AI收入暴涨34%,$60亿锁定AWS到2032
06 Snowflake Q1 AI收入暴涨34%,$60亿锁定AWS到2032
Snowflake Q1产品收入$13.3亿,涨了34%。AI产品线——Cortex AI、Cortex Agents、Document AI——年化收入破$1亿。5200多个客户每周在用AI/ML功能,13600多个账户在使用Snowflake AI。
同一天宣布了一个大单:$60亿锁定AWS到2032年,深度集成Amazon Bedrock和AWS Graviton处理器。AWS CEO说企业在「从实验AI转向把智能Agent投入生产」。Snowflake股价盘后涨了30%以上。
07 Apple Siri换脑,Gemini要在iPhone里跑了
07 Apple Siri换脑,Gemini要在iPhone里跑了
Bloomberg的Mark Gurman泄露了iOS 27的Siri新界面——住在Dynamic Island里的专用Siri app,聊天式界面,跨应用操作,对话历史30天或1年自动删除。
底层不再是苹果自研模型,是Google Gemini。苹果签了多年协议,正在尝试把Gemini蒸馏成能在iPhone上跑的尺寸。M5芯片可以在3秒内跑完300亿参数模型——但Gemini是万亿级的。
WWDC 6月8日开幕。苹果同时在CVPR投了14篇AI论文。Siri这根最粗的AI管线,终于要换了。
08 AWS把搜索服务拆了重做,因为Agent的流量和人不一样
08 AWS把搜索服务拆了重做,因为Agent的流量和人不一样
AWS发布了新一代OpenSearch Serverless,专门为AI Agent的流量模式重新设计。关键词:计算和存储分离。
普通用户搜东西,流量是间歇性的。Agent搜东西,可能瞬间几百个请求同时打过来,然后又归零。旧的搜索引擎架构扛不住这种脉冲式流量。新架构按需启动计算,Agent安静时资源降到零。
Amazon Bedrock的年化AI收入已经超过$150亿。AWS同期的资本支出也创了纪录——回报要等到2027-2028年。
09 孙正义砸€750亿在法国建欧洲最大AI算力集群
09 孙正义砸€750亿在法国建欧洲最大AI算力集群
SoftBank宣布在法国北部投资€750亿(约$875亿),建3.1GW的数据中心容量,远期目标是5GW。选址在敦刻尔克和周边两个城市,施耐德电气参与工程。
这个规模相当于把法国全国的云计算能力翻了一倍不止。欧洲一直在AI基建上落后于美国和中国,孙正义这笔钱是一次「算力马歇尔计划」。
对SoftBank来说,投的是欧洲AI市场的入场券——谁掌握了算力,谁就掌握了未来十年的AI定价权。
10 GREYVIBE黑客组织用ChatGPT和Gemini发动国家级攻击
10 GREYVIBE黑客组织用ChatGPT和Gemini发动国家级攻击
安全公司披露了一个叫GREYVIBE的俄罗斯黑客组织,正在系统性地用ChatGPT和Google Gemini来发动网络攻击——从生成钓鱼邮件到编写恶意代码,再到分析目标网络拓扑。
这不是传统的「黑客用AI」。这是AI模型被当作攻击基础设施在用。对于OpenAI和Google来说,安全不再只是防越狱——模型本身就是武器。
也是为什么OpenAI同一周推出了选举安全措施和Rosalind Biodefense:不是AI公司在做慈善,是对手和监管都在看着。
11 NVIDIA DynoSim加速1500倍,MCG一分钟搞定AI合规文档
11 NVIDIA DynoSim加速1500倍,MCG一分钟搞定AI合规文档
NVIDIA发了两个工具。DynoSim是一个LLM部署模拟器,能在几分钟内画出一个模型在不同GPU配置下的最优部署方案——以前这需要几天的实测。速度比实时快了1500倍。
MCG Toolkit自动生成AI模型文档——输入模型参数,一分钟输出符合加州AB-2013和欧盟AI Act的Model Card。法规合规从「雇律师写一个月」变成了「点一下按钮」。两个工具瞄准同一个痛点:AI从实验到生产的最后一公里。
12 Claude Code还在日增300星,编程Agent的竞争按周在迭代
12 Claude Code还在日增300星,编程Agent的竞争按周在迭代
GitHub Trending上Claude Code还在以每天约300星的速度涨。Opus 4.8的Dynamic Workflows让它从一个编程助手变成了一个能管几十个并行子任务的Agent编排器。
Grok Build 0.1、Cursor Composer 2.5、Mistral Vibe for Code——编程Agent这个赛道一周内挤进了三个新玩家。但Claude Code有两个对手没有的东西:上百个版本的工程积累和Opus 4.8的诚实度。
编程这件事从「人写代码AI补全」到「人说需求AI全包」,过渡比所有人预期的都快。
13 Google和DeepMind的战略分歧浮出水面
13 Google和DeepMind的战略分歧浮出水面
Google和DeepMind之间正在出现路线分歧。Google要的是实用——成本低、跑得快、能在TPU 8i上部署的模型。DeepMind要的是AGI——原生多模态、世界模型、Gemini Omni那个方向。
Gemini Omni的Flash版本先于完整版发布,就是一个妥协的结果。Google让DeepMind先把「能用的」交出来,AGI的事往后放。这种张力不是坏事。但一家公司同时跑两条路,资源分配迟早要打架。
14 空客签了Mistral五年长约,工业AI从仿真渗透到生产
14 空客签了Mistral五年长约,工业AI从仿真渗透到生产
Mistral在巴黎峰会上宣布空客签了5年合作,覆盖商业飞机、直升机、国防和太空四个部门。宝马也在用Mistral做碰撞仿真——以前跑一次要几小时,现在几分钟。
关键不是AI能生成设计图。关键是把物理仿真引擎和LLM整合在一起——AI不只是「画了一个机翼」,是「算出了这个机翼在超音速下的应力分布」。工业AI的壁垒不在语言模型,在物理精度。
15 AWS Resilience Hub用AI做SRE,宕机前就预测到问题
15 AWS Resilience Hub用AI做SRE,宕机前就预测到问题
AWS把生成式AI整合进了Resilience Hub,让AI来做站点可靠性工程。以前SRE靠监控面板和经验判断什么时候可能出问题。现在是AI主动检测异常、推荐修复方案,甚至根据应用类型和风险等级自动生成恢复计划。
这个方向比模型基准有意思:AI在做一件对人类来说极难的事——在几百万个信号里找到那一个异常。
16 Snowflake AI产品年化破$1亿,企业数据仓库在AI化
16 Snowflake AI产品年化破$1亿,企业数据仓库在AI化
Snowflake的AI产品线——Cortex AI、Cortex Agents、Document AI——年化收入破了$1亿。5200多个客户每周在用AI/ML功能。
和Databricks的竞争也在升级。Databricks同一天推出了Model Units——一个LLM推理的抽象层,声称能省80%的GPU成本,每月处理120万亿Token。两家的AI路线不同:Snowflake从数据仓库往上建AI,Databricks从数据工程往外拓推理。
17 Apple WWDC倒计时一周,14篇AI论文铺路
17 Apple WWDC倒计时一周,14篇AI论文铺路
WWDC 2026 6月8日开幕,Apple在CVPR投了14篇AI论文。从LLM图像生成、多模态推理的空间功能智能,到实时视频流模型和可访问性AI。
还有一个信号:Apple正在评估收购LiquidAI——一家专做端侧模型优化的创业公司。iOS 27的Siri要跑Gemini,但Apple显然不想永远靠Google。端侧AI模型才是Apple的终极答案。
18 微软Copilot超级应用计划曝光,编程聊天Agent全打通
18 微软Copilot超级应用计划曝光,编程聊天Agent全打通
微软在Build 2026前泄露了一个代号「Delivering one Copilot」的超级应用计划:把GitHub Copilot、Copilot Chat、Copilot Cowork和一个叫Autopilot的新Agent功能全打通,做成一个统一的入口。
负责这个项目的是新上任的Copilot负责人Jacob Andreou。目标是今年夏天上线。同一时间微软AI业务年化收入$370亿,涨了123%。但资本支出也破了$400亿——建数据中心的速度跟不上AI需求的增长。
19 Mistral自建10MW数据中心,欧洲AI主权路线图
19 Mistral自建10MW数据中心,欧洲AI主权路线图
Mistral在NOW峰会上宣布了一个€40亿的基础设施计划:200MW到2027年,1GW到2030年。第一座10MW推理数据中心今年Q3在巴黎南郊启用,瑞典还有一个站点准备跑NVIDIA下一代Vera Rubin GPU。
Mistral CEO Arthur Mensch在法国议会说过:欧洲大概有两年时间建足够的基础设施,否则会变成美国云计算巨头的「附庸国」。10MW不算大。但意义不在规模——在于欧洲终于有AI公司在自己建基础设施了。
20 DeepMind产品VP说AI下一阶段取决于信任不是基准分
20 DeepMind产品VP说AI下一阶段取决于信任不是基准分
Google DeepMind产品VP Tulsee Doshi在Fast Company采访里说了一段话:AI下一阶段的瓶颈不是模型能力,是用户信任。
她说Agent有三个问题还没解决:谄媚(sycophancy)、安全护栏、以及用户怎么验证AI做对了。Google能做的是同时服务2B企业客户和她妈这样的普通用户——但前提是两个群体都信任这个系统。
这句话放在Opus 4.8把「诚实度」当核心卖点的同一周,不是巧合。AI行业正在从「能做什么」切换到「做对了没有」。