标签

AI 快讯|Anthropic 冲刺万亿估值,Claude 可调度百 Agent 协同

发布时间:2026-05-30 00:44来源:微信阅读:7

今日 AI 领域最震撼的消息,均围绕 Anthropic 展开。

一方面,Claude Opus 4.8 在发布 43 天后迅速推出新版,直接展示“动态工作流”——单次任务能调度数百个子 Agent 并行执行。另一方面,650 亿美元 H 轮融资到位,估值高达 9650 亿,距离万亿大关仅一步之遥。

将这两件事结合来看,信号十分清晰:Anthropic 不仅在打磨更优秀的模型,更是在押注 Agent 时代的基础设施。

Opus 4.8 的升级逻辑颇具深意——不追求参数量的爆发式增长,而是聚焦解决开发者最头疼的“胡编乱造”问题。

新模型更倾向于承认不确定性,对不确定的信息会主动提示风险,忽略代码缺陷的概率降至上一代的四分之一。在 Terminal-Bench 2.1 上得分 74.2%,较 4.7 版本提升 8.4%;SWE-Bench Pro 也上涨了近 5%。

但真正的杀手锏是 Dynamic Workflows。Claude 如今能像项目经理一样,将复杂任务拆解并分发给数百个子 Agent 并行处理——自动规划、分配、执行、验证、汇总,全程无需人工干预。这对大型代码迁移、数据处理等场景而言,堪称质的飞跃。

代价何在?高强度推理模式下表现卓越,但一旦切换至普通模式,编码得分便从 63 骤降至 42。换言之,若想令 Claude 真正“封神”,需不惜投入大量 Token。

此外,Anthropic 预告了 Claude Mythos,预计数周内开放。从 4.7 到 4.8 仅隔 43 天,至 Mythos 又仅隔数周——这一发布节奏本身便说明了诸多问题。

H 轮融资 650 亿美元,投后估值达 9650 亿。Sequoia、红杉、Altimeter、Dragoneer 领投。

更值得关注的数据:本月年化营收已突破 470 亿美元。且 Claude 是目前唯一同时登陆 AWS、Google Cloud 和 Azure 的前沿模型,背后更有与亚马逊签署的 5GW 算力协议,以及同谷歌、博通达成的下一代 TPU 协议。

Sequoia 合伙人曾言一句值得深思的话:企业正利用 Claude 处理复杂工作流,Claude 借此学习企业的真实运作模式——包括上下文、流程与判断力。此轮融资的意义不仅在于资金,更在于 Claude 在企业级应用中的深度渗透。

查看 OpenRouter 最新月榜,DeepSeek 的表现令人咋舌:V4 Flash 月调用量 9.13T tokens 居首,V4 Pro 3.89T 排第九,V3.2 4.07T 排第八。三款模型合计调用量超 17 万亿 tokens。

但更关键的转变在于:Token 消耗的绝对主力已从聊天机器人转向 Agent 系统。排名前两位的应用 Hermes Agent 和 OpenClaw,月调用量分别达 10.8T 和 6.25T tokens。

这种“万亿级”的高并发强度,将底层基础设施的每一处短板无限放大。MoE 架构的通信瓶颈、百万级上下文的内存压力、低精度量化的可靠性——头部模型均撞上了同一堵墙。

昇腾的应对之策是三大招:MegaMoE 通算融合算子(Prefill 性能提升 20%-30%)、KVCache 池化方案(Prefill 提升 4 倍以上)、硬件原生 MXFP 支撑。DeepSeek V4 开源首日即在昇腾上运行,并非削足适履,而是因为这堵墙无人能避。

古尔曼透露,iOS 27 将对 Siri 进行重大改造。Siri 将变为独立聊天 App,界面类似 ChatGPT,融入灵动岛,支持语音及下滑搜索两种交互方式。更激进的是,苹果计划让 Siri 接入 ChatGPT、Gemini、Claude 等多种 AI 模型——用户可自主选择。

腾讯在游戏发布会首推 AI 游戏创作平台“代号 Craft”。通过自然语言输入创意,AI 自动生成可运行的 2D/3D 游戏。平台内置全链路 AIGC 工具——涵盖角色立绘、3D 模型、骨骼动画、场景、音效,并免费开放上万种预制美术资产。设计理念是“下限够低、上限够高”:零基础小白可借助策划知识库理清需求,专业开发者可进行工业级精调。

面壁智能携手 OpenBMB 连续发布五项端侧 AI 技术:1.58-bit 低比特训练大模型 BitCPM-CANN、性能超两倍参数模型的 MiniCPM5-1B、AI 自主编写且速度超越英伟达 Megatron 的训练框架 ForgeTrain、智能体操作系统 PilotDeck,以及核心数据集 UltraData。MiniCPM5-1B 在部分任务上已超越 GPT-4o 某些版本——端侧模型正以惊人速度“吞噬”云端模型的能力版图。

联想推出三款 AI 边缘设备:mini 100(面向一人公司,Token 成本降低 70%-95%)、300(本地运行 35B 多模态模型)、Pro 700(支持 122B 模型与多机集群)。核心逻辑是将推理能力本地化,一次性投入后算力成本固定,数据亦本地存储不外流。对那些因 Token 账单而不敢放开使用 Agent 的用户而言,这无疑是一个务实的解决方案。

创始人张佳源宣布 M3 模型即将发布,特别邀请中文开源社区贡献者加入飞书群抢先评测。需具备开源项目贡献经验。

OpenAI 推出 Auto Review 功能——利用一个 AI Agent 实时监督主 Agent 的每一步操作,防止有害行为发生。这解锁了新用法:让 Agent 整夜处理敏感数据,无需人工值守。

Google 推出 AI 驱动网络安全解决方案,利用 Wiz 平台进行安全扫描,Gemini 执行持续深度扫描,CodeMender 负责软件修复。面对日益增多的 AI 攻击,以 AI 防御 AI 正成为标配。

今日最有趣的细节:Opus 4.8 的桌面端遭猛烈批评。Chat、Code、Cowork 三个标签页的设计被指“混乱不堪”,导致许多人虽认可模型实力,日常仍选择 GPT-5.5。

这揭示了一个事实:在 Agent 时代,模型能力的上限确实在不断攀升,但“易用性”反而变得愈发关键。当模型需调度数百个子 Agent、处理十几万行代码时,交互设计的优劣直接决定用户是否愿意交付复杂任务。

Anthropic 虽获万亿估值及最强模型,但桌面端的短板可能比跑分上的不足更为致命。