AI Token 迈入配额制:巨头严管算力成本
近期,众多科技企业内部涌现出一项新动向。
往昔,AI 被视为员工的一项福利。
开发人员撰写代码,调用模型。
产品经理开展调研,调用模型。
运营人员撰写方案,调用模型。
只要提出需求,大家便默认可随时调用。
然而近期局势悄然生变。
越来越多的企业着手为 AI 设定额度、建立审批流程及规范使用准则。
有人察觉 Token 已告急。
有人感到申请周期被拉长。
还有人发现,昔日随手可得的模型,如今需额外审批。
若仅审视单一案例,这似乎仅是企业内部管理的微调。
但若将腾讯、米哈游、微软近期的举措并置观察,便会发现一个更宏大的转折:
AI 产业正从“先试用再说”,迈向“每一分算力皆需核算”的新阶段。
6 月上旬,一则关于腾讯内部调整 AI Token 配额的新闻引发热议。
据公开报道,腾讯正把原先相对统一的 Token 配额机制,优化为依据工作任务与实际需求动态分配。
尤为关键的是,内部通知特别指明:
总体投入只增不减。
这表明腾讯并非在缩减 AI 投入。
恰恰相反,它正在重构资源分配模式。
并非人人均等分配,而是谁创造更大价值,谁便获取更多资源。
与此同时,在同日举办的腾讯云 AI 产业应用大会上,腾讯高级执行副总裁汤道生披露:
今年腾讯大部分代码已由 AI 自动生成。
此言蕴含的信息量极大。
过去,AI 更多扮演辅助角色。
如今,它正逐步演变为生产流程本身。
当代码生成成为研发主流程时,Token 的属性也随之改变。
它已转化为生产资料。
服务器如何分配,将影响业务效率。
算力如何分配,同样关乎业务效率。
由此视角看,腾讯实则是在调整生产力资源。
若说腾讯展现的是资源分配逻辑。
那么米哈游展示的,则是 AI 时代真实存在的成本压力。
5 月 20 日,在 2026 阿里云峰会上,《崩坏》系列 Gameplay 技术团队负责人郑银河分享了一段内部经历。
某项目员工搭建数十个 Agent 协同作业,未设额度限制,结果一夜之间消耗了价值约 200 万元人民币的模型调用资源。
现场不少听众闻言皆是一怔。
因为这一数字远超大多数人对 Token 成本的认知。
许多人对大模型的理解仍停留在:
单次调用几分钱。
单次对话几毛钱。
但在企业级场景的 Agent 模式下,情况截然不同。
当系统开始:
自动搜集资料
自动调用工具
自动规划任务
自动执行多轮推理
多个 Agent 并行协作
Token 成本增长往往呈非线性。
单个 Agent 或许无妨。
数十个 Agent 连续运行数小时甚至数十小时,成本将迅速放大。
更为重要的是,此次分享并非事故通报。
亦非系统故障。
而是真实探索过程中产生的实际成本。
这也揭示了一个问题:
AI 最棘手的阶段,已非“能否实现”。
而是“实现后是否值得长期运行”。
若说国内企业关注成本尚可理解。
那么微软的举动更值得深思。
据海外媒体报道,微软内部正加强对部分外部 AI 工具的使用管控。
Claude Code 等部分高成本开发工具需经额外审批流程。
部分团队反馈,使用外部 AI 编程工具的门槛正在提高。
需说明的是:微软并非禁止使用这些工具。真正发生转变的是管理方式。
过去:想用即用。
现在:为何要用?是否值得?是否存在更低成本的替代方案?
这些问题开始被摆上桌面。
而这恰恰折射出整个行业的变迁。
即便拥有全球最强大的云计算资源之一,即便深度参与 AI 产业链,微软仍在认真核算每一笔 AI 支出。
因为企业最终面对的是真实账单。
若回顾云计算的发展史,会发现一个极为相似的过程。
最初几年大家疯狂上云,能迁移的业务全部迁移。
先抢时间,先抢规模。
随后企业逐渐发现:云虽便捷,但也昂贵。
于是一个新领域应运而生:FinOps,即云成本治理。
大家开始钻研:
这台机器是否浪费?
这个集群是否闲置?
这笔支出是否创造了价值?
今日的 AI 行业,正经历同样的阶段。
过去两年。
行业探讨的是模型能力。
GPT 强不强?
Claude 强不强?
Gemini 强不强?
DeepSeek 强不强?
而现在。
越来越多的企业开始探讨另一个问题:
若让它每日运行 100 万次,是否仍划算?
这看似仅是一个财务问题。
实则,它决定了 AI 能否真正落地。
腾讯在重新分配 Token。
米哈游开始感知 Agent 的真实成本。
微软加强外部工具治理。
看似是三件互不相关之事。
但背后反映的是同一趋势。
昔日的 AI 行业属于探索期。
逻辑是:先试先跑,先把能力做出来,成本可往后看。
而现在行业开始进入运营期,逻辑转变为:
每一份算力都要产生价值。
每一个 Agent 都要证明自己存在的意义。
每一次模型调用都需要解释为何值得。
这并非 AI 降温,而是 AI 真正进入生产系统的标志。
因为只有当一项技术开始被认真核算成本时,它才真正成为企业经营体系的一部分。
两年前,大厂讨论的是模型参数。
一年前,大厂讨论的是 Agent。
而今天,大厂开始讨论账单。
当一家企业开始认真核算每一枚 Token 的去向时,AI 就已是实验室之外的未来技术。
它正在变成企业每天都要面对的生产力工具。
而未来企业之间真正的差距,或许就在于谁能将有限的算力,投入到最能创造价值的地方。
——————————————————
公众号:荒岛书生 codedoctor
视频号:荒岛书生 codedoctor
小红书:codedoctor
Token 消耗大户,每日对着麦克风和 Claude / Codex AI 智能体交流。