标签

AI Token 迈入配额制:巨头严管算力成本

发布时间:2026-06-10 20:18来源:微信阅读:2

近期,众多科技企业内部涌现出一项新动向。

往昔,AI 被视为员工的一项福利。

开发人员撰写代码,调用模型。

产品经理开展调研,调用模型。

运营人员撰写方案,调用模型。

只要提出需求,大家便默认可随时调用。

然而近期局势悄然生变。

越来越多的企业着手为 AI 设定额度、建立审批流程及规范使用准则。

有人察觉 Token 已告急。

有人感到申请周期被拉长。

还有人发现,昔日随手可得的模型,如今需额外审批。

若仅审视单一案例,这似乎仅是企业内部管理的微调。

但若将腾讯、米哈游、微软近期的举措并置观察,便会发现一个更宏大的转折:

AI 产业正从“先试用再说”,迈向“每一分算力皆需核算”的新阶段。

6 月上旬,一则关于腾讯内部调整 AI Token 配额的新闻引发热议。

据公开报道,腾讯正把原先相对统一的 Token 配额机制,优化为依据工作任务与实际需求动态分配。

尤为关键的是,内部通知特别指明:

总体投入只增不减。

这表明腾讯并非在缩减 AI 投入。

恰恰相反,它正在重构资源分配模式。

并非人人均等分配,而是谁创造更大价值,谁便获取更多资源。

与此同时,在同日举办的腾讯云 AI 产业应用大会上,腾讯高级执行副总裁汤道生披露:

今年腾讯大部分代码已由 AI 自动生成。

此言蕴含的信息量极大。

过去,AI 更多扮演辅助角色。

如今,它正逐步演变为生产流程本身。

当代码生成成为研发主流程时,Token 的属性也随之改变。

它已转化为生产资料。

服务器如何分配,将影响业务效率。

算力如何分配,同样关乎业务效率。

由此视角看,腾讯实则是在调整生产力资源。

若说腾讯展现的是资源分配逻辑。

那么米哈游展示的,则是 AI 时代真实存在的成本压力。

5 月 20 日,在 2026 阿里云峰会上,《崩坏》系列 Gameplay 技术团队负责人郑银河分享了一段内部经历。

某项目员工搭建数十个 Agent 协同作业,未设额度限制,结果一夜之间消耗了价值约 200 万元人民币的模型调用资源。

现场不少听众闻言皆是一怔。

因为这一数字远超大多数人对 Token 成本的认知。

许多人对大模型的理解仍停留在:

单次调用几分钱。

单次对话几毛钱。

但在企业级场景的 Agent 模式下,情况截然不同。

当系统开始:

自动搜集资料

自动调用工具

自动规划任务

自动执行多轮推理

多个 Agent 并行协作

Token 成本增长往往呈非线性。

单个 Agent 或许无妨。

数十个 Agent 连续运行数小时甚至数十小时,成本将迅速放大。

更为重要的是,此次分享并非事故通报。

亦非系统故障。

而是真实探索过程中产生的实际成本。

这也揭示了一个问题:

AI 最棘手的阶段,已非“能否实现”。

而是“实现后是否值得长期运行”。

若说国内企业关注成本尚可理解。

那么微软的举动更值得深思。

据海外媒体报道,微软内部正加强对部分外部 AI 工具的使用管控。

Claude Code 等部分高成本开发工具需经额外审批流程。

部分团队反馈,使用外部 AI 编程工具的门槛正在提高。

需说明的是:微软并非禁止使用这些工具。真正发生转变的是管理方式。

过去:想用即用。

现在:为何要用?是否值得?是否存在更低成本的替代方案?

这些问题开始被摆上桌面。

而这恰恰折射出整个行业的变迁。

即便拥有全球最强大的云计算资源之一,即便深度参与 AI 产业链,微软仍在认真核算每一笔 AI 支出。

因为企业最终面对的是真实账单。

若回顾云计算的发展史,会发现一个极为相似的过程。

最初几年大家疯狂上云,能迁移的业务全部迁移。

先抢时间,先抢规模。

随后企业逐渐发现:云虽便捷,但也昂贵。

于是一个新领域应运而生:FinOps,即云成本治理。

大家开始钻研:

这台机器是否浪费?

这个集群是否闲置?

这笔支出是否创造了价值?

今日的 AI 行业,正经历同样的阶段。

过去两年。

行业探讨的是模型能力。

GPT 强不强?

Claude 强不强?

Gemini 强不强?

DeepSeek 强不强?

而现在。

越来越多的企业开始探讨另一个问题:

若让它每日运行 100 万次,是否仍划算?

这看似仅是一个财务问题。

实则,它决定了 AI 能否真正落地。

腾讯在重新分配 Token。

米哈游开始感知 Agent 的真实成本。

微软加强外部工具治理。

看似是三件互不相关之事。

但背后反映的是同一趋势。

昔日的 AI 行业属于探索期。

逻辑是:先试先跑,先把能力做出来,成本可往后看。

而现在行业开始进入运营期,逻辑转变为:

每一份算力都要产生价值。

每一个 Agent 都要证明自己存在的意义。

每一次模型调用都需要解释为何值得。

这并非 AI 降温,而是 AI 真正进入生产系统的标志。

因为只有当一项技术开始被认真核算成本时,它才真正成为企业经营体系的一部分。

两年前,大厂讨论的是模型参数。

一年前,大厂讨论的是 Agent。

而今天,大厂开始讨论账单。

当一家企业开始认真核算每一枚 Token 的去向时,AI 就已是实验室之外的未来技术。

它正在变成企业每天都要面对的生产力工具。

而未来企业之间真正的差距,或许就在于谁能将有限的算力,投入到最能创造价值的地方。

——————————————————

公众号:荒岛书生 codedoctor

视频号:荒岛书生 codedoctor

小红书:codedoctor

Token 消耗大户,每日对着麦克风和 Claude / Codex AI 智能体交流。