订阅制被瓦解？Anthropic改计费与OpenAI下场做部署公司

发布时间：2026-05-15 10:57阅读：18

今日一句话： AI 行业正从单纯的“模型比拼”迈向“使用权、部署权及工作流掌控权”的新阶段。对开发者而言，Agent已不再局限于更智能的聊天机器人，而是演变为一种持续消耗算力、调用外部工具并重塑业务流程的新型生产体系。

据VentureBeat报道，Anthropic已恢复用户通过第三方Agent调用Claude的能力，如OpenClaw等工具。但这并非简单回退，而是引入了新的Agent SDK Credits计费模式。

简言之，Claude Pro、Max 5x及Max 20x用户仍可借助第三方Agent使用Claude，但程序化调用将独立于订阅套餐，单独计入固定额度。额度耗尽后需额外购买，不再享受“无限池”待遇。

此前争议焦点在于，部分用户利用20至200美元的订阅在第三方Agent中消耗了远超订阅费用的Token成本。对Anthropic而言，这并非单纯的“用户活跃”，而是“商业模式被Agent自动化机制击穿”。

这件事传递的真实信号并非Anthropic“封禁”第三方Agent，而是无限订阅制正逐渐被Agent应用场景所瓦解。

过去的订阅制默认假设使用者是人类，人类会休息、暂停、切换任务。然而Agent截然不同，它能全天候运行，反复处理文件、修改代码、执行测试及调用工具。只要开放程度足够，一个20美元的订阅用户可能产生数千美元的推理成本。

因此，此次调整本质上是在重新定义Claude订阅：

Claude订阅正逐渐演变为“人类交互入口”，而非“Agent算力通行证”。

对开发者社区而言，这无疑会造成心理落差。许多人购买Max，并非为了多进行几轮对话，而是为了将Claude Code、OpenClaw及各类本地Agent当作半自动工程师使用。若额度被单独切割，订阅价值将面临重估。

Mira Murati创立的Thinking Machines发布了“交互模型”研究预览版，专注于近实时的语音、视频与文本交互。

这类模型的核心亮点不在于新增语音助手功能，而在于试图打破传统AI对话的“回合制”结构。以往大多数语音模型遵循：

用户陈述 → 模型转录 → 模型思考 → 模型生成 → 模型播放

此流程天然存在停顿感。Thinking Machines展示的新交互模型强调全双工实时交互：模型可在接收输入的同时输出，也能在用户未说完时理解意图并调整回应节奏。

报道指出，该模型响应延迟约0.40秒，显著低于GPT-realtime-2.0的1.18秒。模型采用大规模MoE架构，并辅以后台模型处理复杂推理任务。

语音AI的竞争焦点正从“能否听懂”转向“能否自然接话”。

过去语音助手最大的违和感在于，它像必须等待用户说完才能反应的客服系统。但人类对话并非如此：我们会插话、点头，并根据语气预判对方下一句。

Thinking Machines的方向表明，下一代语音模型不仅是语音的输入输出，更是要重建“交互节奏”。这将影响客服、教育、陪练、会议助手及远程协作等场景。

假如2023年的关键词是ChatGPT，2024-2025年是Agent，那么2026年的一个关键词或许是：

AI从“回答系统”转变为“实时参与者”。

OpenAI于5月11日宣布成立OpenAI Deployment Company，并同意收购AI咨询与工程公司Tomoro。

该公司由OpenAI控股，首期投资逾40亿美元。Tomoro约150名Forward Deployed Engineers及部署专家将加入新公司，协助企业将AI接入数据、工具、控制系统及核心业务流程。

OpenAI官方对此表述明确：模型只是第一步，真正的难点在于将AI转化为企业每日可信赖的生产系统。

该公司将承担以下职能：

OpenAI正从“售卖模型”迈向“售卖结果”。

此举类似Palantir的Forward Deployed Engineer模式，但OpenAI的独特之处在于拥有最前沿的模型、Agent工具及开发者生态。企业客户真正匮乏的并非“又一个大型模型API”，而是：

OpenAI Deployment Company的出现，标志着企业AI竞争已进入第二阶段：

第一阶段比拼模型能力，第二阶段比拼部署能力，第三阶段比拼组织改造能力。

未来企业客户购买的或许不再是“GPT-5.5 API调用次数”，而是一套“AI改造方案”。

OpenAI发布了GPT-5.5-Cyber限量预览版，并扩展了Trusted Access for Cyber计划。

该框架的核心逻辑在于：并非所有用户均可访问同等网络安全能力。OpenAI将访问权限划分为多个层级：

OpenAI强调，此举非为增强攻击能力，而是为了提升经过验证的防御者在漏洞识别、恶意软件分析、检测工程、补丁验证等任务中的效率。

AI安全策略正从“统一安全策略”向“身份分层授权”演进。

过去AI安全策略常采取“一刀切”方式：普通用户受限，研究人员也常被拒。问题在于，网络安全本质上是典型的双用领域。相同的漏洞复现步骤，对攻击者是武器，对防御者则是必要工具。

OpenAI此次给出的答案是：

不再仅判断“内容是否危险”，而是判断“谁、在何种环境、用于何种目的”。

这或将成为未来双用AI能力开放的通用范式。生物安全、网络安全、金融风控及工业控制等领域，可能均会采用此类“模型能力 + 身份验证 + 审计控制”框架。

The Verge、AP、FT等媒体报道，Musk v. Altman案件已进入闭幕陈述阶段。

此案核心争议仍在于OpenAI是否背离了初衷的非营利使命，以及Microsoft投资及后续商业化结构是否改变了OpenAI的性质。

Musk阵营主张OpenAI从公益导向转向商业化，违背了创立初衷。OpenAI阵营则反驳称Musk主张缺乏法律依据，且其早已知晓相关商业化安排。

此案表面是创始人纠纷，底层实则是AI公司治理结构的博弈。

当一家AI公司兼具非营利使命、巨额商业投资、影响全球基础设施的模型能力及与大科技公司的深度绑定，它应被定义为公益机构、商业公司还是某种新型混合体？

这非OpenAI独有难题。Anthropic、xAI、Google DeepMind、Meta AI未来均将面临类似挑战：当模型能力日益增强，公司的治理结构、投资人权益、公共责任与商业利益如何平衡？

The Verge报道，xAI推出面向SuperGrok Heavy订阅用户的Grok Build早期Beta版。

其定位为Agent式编码CLI工具，对标Anthropic的Claude Code与OpenAI的Codex。换言之，xAI不再满足于让Grok在聊天框内回答问题，而是希望Grok直接进入开发者终端，参与实际代码任务。

编码Agent已成为大模型公司的必争之地。

理由在于：开发者是最早接纳AI接入真实工作流的人群，也是最能快速验证Agent价值的人群。谁能占据开发者终端，谁就能获取高频任务数据、工程环境反馈、企业采用入口以及对模型能力的真实压力测试。

Claude Code、Codex、Grok Build的竞争，本质上是“谁能成为软件生产链路中的默认Agent”。

The Verge援引Bloomberg称，OpenAI正考虑对Apple采取法律行动，可能包括发送违约通知。

据报道，OpenAI原预期ChatGPT深度集成Apple系统后会带来更多订阅用户及深层集成，但实际效果似乎未达预期。

这表明一个问题：AI公司获得系统级入口，不等于自动获得用户转化。

Apple的入口价值虽高，但其产品哲学是将第三方能力包装进自身系统体验。用户可能使用了ChatGPT能力，却不一定意识到自己在使用OpenAI，更未必愿为OpenAI单独付费。

这对AI公司是重要提醒：

分发入口固然重要，但品牌归属、付费路径及深度集成同样关键。

InfoQ中文站有两篇文章值得关注。

第一篇探讨AI驱动的UI自动化实践：从生成工具、自动化调试到生产投放，配合质量监控，推动前端界面生产从手工迭代转向自动运转。

第二篇讨论“本地优先”的AI文档处理架构：将70%-80%文档通过本地确定性方式低成本处理，边缘复杂场景再交由Azure OpenAI，低置信度结果推送给人工审核。

国内企业AI落地正日趋务实。

并非所有任务皆需大模型，并非所有流程皆应上云。真正成熟的AI工程方案，往往是混合架构：能规则处理的先本地处理，需理解能力的再调用模型，低置信度的交由人工，全流程以指标监控质量与成本。

此类实践比“再发布一个大模型”更值得企业关注，因为它们直接回应了两个核心问题：

如何降本？如何落地生产？

← 上一篇：AI算力新战场：电力瓶颈催生基础设施革命下一篇：AI 一人公司首选！滨海湾重磅护航创业路 →