AI 快讯|Anthropic 冲刺万亿估值，Claude 可调度百 Agent 协同

发布时间：2026-05-30 00:44阅读：17

今日 AI 领域最震撼的消息，均围绕 Anthropic 展开。

一方面，Claude Opus 4.8 在发布 43 天后迅速推出新版，直接展示“动态工作流”——单次任务能调度数百个子 Agent 并行执行。另一方面，650 亿美元 H 轮融资到位，估值高达 9650 亿，距离万亿大关仅一步之遥。

将这两件事结合来看，信号十分清晰：Anthropic 不仅在打磨更优秀的模型，更是在押注 Agent 时代的基础设施。

Opus 4.8 的升级逻辑颇具深意——不追求参数量的爆发式增长，而是聚焦解决开发者最头疼的“胡编乱造”问题。

新模型更倾向于承认不确定性，对不确定的信息会主动提示风险，忽略代码缺陷的概率降至上一代的四分之一。在 Terminal-Bench 2.1 上得分 74.2%，较 4.7 版本提升 8.4%；SWE-Bench Pro 也上涨了近 5%。

但真正的杀手锏是 Dynamic Workflows。Claude 如今能像项目经理一样，将复杂任务拆解并分发给数百个子 Agent 并行处理——自动规划、分配、执行、验证、汇总，全程无需人工干预。这对大型代码迁移、数据处理等场景而言，堪称质的飞跃。

代价何在？高强度推理模式下表现卓越，但一旦切换至普通模式，编码得分便从 63 骤降至 42。换言之，若想令 Claude 真正“封神”，需不惜投入大量 Token。

此外，Anthropic 预告了 Claude Mythos，预计数周内开放。从 4.7 到 4.8 仅隔 43 天，至 Mythos 又仅隔数周——这一发布节奏本身便说明了诸多问题。

H 轮融资 650 亿美元，投后估值达 9650 亿。Sequoia、红杉、Altimeter、Dragoneer 领投。

更值得关注的数据：本月年化营收已突破 470 亿美元。且 Claude 是目前唯一同时登陆 AWS、Google Cloud 和 Azure 的前沿模型，背后更有与亚马逊签署的 5GW 算力协议，以及同谷歌、博通达成的下一代 TPU 协议。

Sequoia 合伙人曾言一句值得深思的话：企业正利用 Claude 处理复杂工作流，Claude 借此学习企业的真实运作模式——包括上下文、流程与判断力。此轮融资的意义不仅在于资金，更在于 Claude 在企业级应用中的深度渗透。

查看 OpenRouter 最新月榜，DeepSeek 的表现令人咋舌：V4 Flash 月调用量 9.13T tokens 居首，V4 Pro 3.89T 排第九，V3.2 4.07T 排第八。三款模型合计调用量超 17 万亿 tokens。

但更关键的转变在于：Token 消耗的绝对主力已从聊天机器人转向 Agent 系统。排名前两位的应用 Hermes Agent 和 OpenClaw，月调用量分别达 10.8T 和 6.25T tokens。

这种“万亿级”的高并发强度，将底层基础设施的每一处短板无限放大。MoE 架构的通信瓶颈、百万级上下文的内存压力、低精度量化的可靠性——头部模型均撞上了同一堵墙。

昇腾的应对之策是三大招：MegaMoE 通算融合算子（Prefill 性能提升 20%-30%）、KVCache 池化方案（Prefill 提升 4 倍以上）、硬件原生 MXFP 支撑。DeepSeek V4 开源首日即在昇腾上运行，并非削足适履，而是因为这堵墙无人能避。

古尔曼透露，iOS 27 将对 Siri 进行重大改造。Siri 将变为独立聊天 App，界面类似 ChatGPT，融入灵动岛，支持语音及下滑搜索两种交互方式。更激进的是，苹果计划让 Siri 接入 ChatGPT、Gemini、Claude 等多种 AI 模型——用户可自主选择。

腾讯在游戏发布会首推 AI 游戏创作平台“代号 Craft”。通过自然语言输入创意，AI 自动生成可运行的 2D/3D 游戏。平台内置全链路 AIGC 工具——涵盖角色立绘、3D 模型、骨骼动画、场景、音效，并免费开放上万种预制美术资产。设计理念是“下限够低、上限够高”：零基础小白可借助策划知识库理清需求，专业开发者可进行工业级精调。

面壁智能携手 OpenBMB 连续发布五项端侧 AI 技术：1.58-bit 低比特训练大模型 BitCPM-CANN、性能超两倍参数模型的 MiniCPM5-1B、AI 自主编写且速度超越英伟达 Megatron 的训练框架 ForgeTrain、智能体操作系统 PilotDeck，以及核心数据集 UltraData。MiniCPM5-1B 在部分任务上已超越 GPT-4o 某些版本——端侧模型正以惊人速度“吞噬”云端模型的能力版图。

联想推出三款 AI 边缘设备：mini 100（面向一人公司，Token 成本降低 70%-95%）、300（本地运行 35B 多模态模型）、Pro 700（支持 122B 模型与多机集群）。核心逻辑是将推理能力本地化，一次性投入后算力成本固定，数据亦本地存储不外流。对那些因 Token 账单而不敢放开使用 Agent 的用户而言，这无疑是一个务实的解决方案。

创始人张佳源宣布 M3 模型即将发布，特别邀请中文开源社区贡献者加入飞书群抢先评测。需具备开源项目贡献经验。

OpenAI 推出 Auto Review 功能——利用一个 AI Agent 实时监督主 Agent 的每一步操作，防止有害行为发生。这解锁了新用法：让 Agent 整夜处理敏感数据，无需人工值守。

Google 推出 AI 驱动网络安全解决方案，利用 Wiz 平台进行安全扫描，Gemini 执行持续深度扫描，CodeMender 负责软件修复。面对日益增多的 AI 攻击，以 AI 防御 AI 正成为标配。

今日最有趣的细节：Opus 4.8 的桌面端遭猛烈批评。Chat、Code、Cowork 三个标签页的设计被指“混乱不堪”，导致许多人虽认可模型实力，日常仍选择 GPT-5.5。

这揭示了一个事实：在 Agent 时代，模型能力的上限确实在不断攀升，但“易用性”反而变得愈发关键。当模型需调度数百个子 Agent、处理十几万行代码时，交互设计的优劣直接决定用户是否愿意交付复杂任务。

Anthropic 虽获万亿估值及最强模型，但桌面端的短板可能比跑分上的不足更为致命。

← 上一篇：AI浪潮席卷全民应用，但多数人尚未觉醒下一篇：AI制作PPT的三个核心技巧 →