订阅制被瓦解?Anthropic改计费与OpenAI下场做部署公司
今日一句话: AI 行业正从单纯的“模型比拼”迈向“使用权、部署权及工作流掌控权”的新阶段。对开发者而言,Agent已不再局限于更智能的聊天机器人,而是演变为一种持续消耗算力、调用外部工具并重塑业务流程的新型生产体系。
据VentureBeat报道,Anthropic已恢复用户通过第三方Agent调用Claude的能力,如OpenClaw等工具。但这并非简单回退,而是引入了新的Agent SDK Credits计费模式。
简言之,Claude Pro、Max 5x及Max 20x用户仍可借助第三方Agent使用Claude,但程序化调用将独立于订阅套餐,单独计入固定额度。额度耗尽后需额外购买,不再享受“无限池”待遇。
此前争议焦点在于,部分用户利用20至200美元的订阅在第三方Agent中消耗了远超订阅费用的Token成本。对Anthropic而言,这并非单纯的“用户活跃”,而是“商业模式被Agent自动化机制击穿”。
这件事传递的真实信号并非Anthropic“封禁”第三方Agent,而是无限订阅制正逐渐被Agent应用场景所瓦解。
过去的订阅制默认假设使用者是人类,人类会休息、暂停、切换任务。然而Agent截然不同,它能全天候运行,反复处理文件、修改代码、执行测试及调用工具。只要开放程度足够,一个20美元的订阅用户可能产生数千美元的推理成本。
因此,此次调整本质上是在重新定义Claude订阅:
Claude订阅正逐渐演变为“人类交互入口”,而非“Agent算力通行证”。
对开发者社区而言,这无疑会造成心理落差。许多人购买Max,并非为了多进行几轮对话,而是为了将Claude Code、OpenClaw及各类本地Agent当作半自动工程师使用。若额度被单独切割,订阅价值将面临重估。
Mira Murati创立的Thinking Machines发布了“交互模型”研究预览版,专注于近实时的语音、视频与文本交互。
这类模型的核心亮点不在于新增语音助手功能,而在于试图打破传统AI对话的“回合制”结构。以往大多数语音模型遵循:
用户陈述 → 模型转录 → 模型思考 → 模型生成 → 模型播放
此流程天然存在停顿感。Thinking Machines展示的新交互模型强调全双工实时交互:模型可在接收输入的同时输出,也能在用户未说完时理解意图并调整回应节奏。
报道指出,该模型响应延迟约0.40秒,显著低于GPT-realtime-2.0的1.18秒。模型采用大规模MoE架构,并辅以后台模型处理复杂推理任务。
语音AI的竞争焦点正从“能否听懂”转向“能否自然接话”。
过去语音助手最大的违和感在于,它像必须等待用户说完才能反应的客服系统。但人类对话并非如此:我们会插话、点头,并根据语气预判对方下一句。
Thinking Machines的方向表明,下一代语音模型不仅是语音的输入输出,更是要重建“交互节奏”。这将影响客服、教育、陪练、会议助手及远程协作等场景。
假如2023年的关键词是ChatGPT,2024-2025年是Agent,那么2026年的一个关键词或许是:
AI从“回答系统”转变为“实时参与者”。
OpenAI于5月11日宣布成立OpenAI Deployment Company,并同意收购AI咨询与工程公司Tomoro。
该公司由OpenAI控股,首期投资逾40亿美元。Tomoro约150名Forward Deployed Engineers及部署专家将加入新公司,协助企业将AI接入数据、工具、控制系统及核心业务流程。
OpenAI官方对此表述明确:模型只是第一步,真正的难点在于将AI转化为企业每日可信赖的生产系统。
该公司将承担以下职能:
OpenAI正从“售卖模型”迈向“售卖结果”。
此举类似Palantir的Forward Deployed Engineer模式,但OpenAI的独特之处在于拥有最前沿的模型、Agent工具及开发者生态。企业客户真正匮乏的并非“又一个大型模型API”,而是:
OpenAI Deployment Company的出现,标志着企业AI竞争已进入第二阶段:
第一阶段比拼模型能力,第二阶段比拼部署能力,第三阶段比拼组织改造能力。
未来企业客户购买的或许不再是“GPT-5.5 API调用次数”,而是一套“AI改造方案”。
OpenAI发布了GPT-5.5-Cyber限量预览版,并扩展了Trusted Access for Cyber计划。
该框架的核心逻辑在于:并非所有用户均可访问同等网络安全能力。OpenAI将访问权限划分为多个层级:
OpenAI强调,此举非为增强攻击能力,而是为了提升经过验证的防御者在漏洞识别、恶意软件分析、检测工程、补丁验证等任务中的效率。
AI安全策略正从“统一安全策略”向“身份分层授权”演进。
过去AI安全策略常采取“一刀切”方式:普通用户受限,研究人员也常被拒。问题在于,网络安全本质上是典型的双用领域。相同的漏洞复现步骤,对攻击者是武器,对防御者则是必要工具。
OpenAI此次给出的答案是:
不再仅判断“内容是否危险”,而是判断“谁、在何种环境、用于何种目的”。
这或将成为未来双用AI能力开放的通用范式。生物安全、网络安全、金融风控及工业控制等领域,可能均会采用此类“模型能力 + 身份验证 + 审计控制”框架。
The Verge、AP、FT等媒体报道,Musk v. Altman案件已进入闭幕陈述阶段。
此案核心争议仍在于OpenAI是否背离了初衷的非营利使命,以及Microsoft投资及后续商业化结构是否改变了OpenAI的性质。
Musk阵营主张OpenAI从公益导向转向商业化,违背了创立初衷。OpenAI阵营则反驳称Musk主张缺乏法律依据,且其早已知晓相关商业化安排。
此案表面是创始人纠纷,底层实则是AI公司治理结构的博弈。
当一家AI公司兼具非营利使命、巨额商业投资、影响全球基础设施的模型能力及与大科技公司的深度绑定,它应被定义为公益机构、商业公司还是某种新型混合体?
这非OpenAI独有难题。Anthropic、xAI、Google DeepMind、Meta AI未来均将面临类似挑战:当模型能力日益增强,公司的治理结构、投资人权益、公共责任与商业利益如何平衡?
The Verge报道,xAI推出面向SuperGrok Heavy订阅用户的Grok Build早期Beta版。
其定位为Agent式编码CLI工具,对标Anthropic的Claude Code与OpenAI的Codex。换言之,xAI不再满足于让Grok在聊天框内回答问题,而是希望Grok直接进入开发者终端,参与实际代码任务。
编码Agent已成为大模型公司的必争之地。
理由在于:开发者是最早接纳AI接入真实工作流的人群,也是最能快速验证Agent价值的人群。谁能占据开发者终端,谁就能获取高频任务数据、工程环境反馈、企业采用入口以及对模型能力的真实压力测试。
Claude Code、Codex、Grok Build的竞争,本质上是“谁能成为软件生产链路中的默认Agent”。
The Verge援引Bloomberg称,OpenAI正考虑对Apple采取法律行动,可能包括发送违约通知。
据报道,OpenAI原预期ChatGPT深度集成Apple系统后会带来更多订阅用户及深层集成,但实际效果似乎未达预期。
这表明一个问题:AI公司获得系统级入口,不等于自动获得用户转化。
Apple的入口价值虽高,但其产品哲学是将第三方能力包装进自身系统体验。用户可能使用了ChatGPT能力,却不一定意识到自己在使用OpenAI,更未必愿为OpenAI单独付费。
这对AI公司是重要提醒:
分发入口固然重要,但品牌归属、付费路径及深度集成同样关键。
InfoQ中文站有两篇文章值得关注。
第一篇探讨AI驱动的UI自动化实践:从生成工具、自动化调试到生产投放,配合质量监控,推动前端界面生产从手工迭代转向自动运转。
第二篇讨论“本地优先”的AI文档处理架构:将70%-80%文档通过本地确定性方式低成本处理,边缘复杂场景再交由Azure OpenAI,低置信度结果推送给人工审核。
国内企业AI落地正日趋务实。
并非所有任务皆需大模型,并非所有流程皆应上云。真正成熟的AI工程方案,往往是混合架构:能规则处理的先本地处理,需理解能力的再调用模型,低置信度的交由人工,全流程以指标监控质量与成本。
此类实践比“再发布一个大模型”更值得企业关注,因为它们直接回应了两个核心问题:
如何降本?如何落地生产?