大厂推行token消耗榜，摸鱼者竟成劳模？

发布时间：2026-04-13 08:30阅读：13

（素材来源：网易科技）

美剧《火线》里藏着一个贯穿多季的伏笔：

巴尔的摩警局为了美化犯罪数据，将重罪降级为轻罪，致使强奸案销声匿迹。高层看着报表上的数字逐月下滑，在市政厅汇报时满脸自豪。

只有街区的居民清楚，街上的枪声从未减少。

剧中有一句台词：You juke the stats and majors become colonels．只要数据造假，少校也能升上校。

然而谁也没料到，2026年，这句话的新版在中国互联网大厂上演了。

只是被篡改的不再是犯罪率，而是AI token 的消耗量。只要你会刷 token，摸鱼也能变成模范员工。

最近，小红书上的一条帖子引发了热议。

一位自称在BAT大厂（首先排除百度）的网友透露：部门突然推行token消耗排行榜，未来试用期转正、年度KPI、晋升都以此为参考，甚至用得少的人可能面临淘汰。

他是三月的榜首，遥遥领先，被老板点名表扬，让他节后给全部门做直播分享如何利用AI提升效率。

但他不敢承认的是，自己超过一半的token，其实是在整理个人数据发笔记。。。

这股风气不止在大厂。

我有个发小在一家公司干了三年，前几天突然被要求：日报中必须填写今天用AI做了哪些工作，提高了多少产能，还要精确到小时。

搞得他现在动不动就要打开AI软件，琢磨着怎么刷数据。

看到这些，差评君第一反应很懵，这不就是2026年版的“工位亮灯等于加班”吗？？

在讨论这件事之前，我们先简单解释一下什么是token。

token是AI处理信息的最小单位，你可以把它看作AI世界的字数或货币，一个中文字大约相当于1到2个token。

你与AI进行一轮对话，消耗的token = 你发给AI的文字 + AI的思考推理 + AI回复的文字。

AI模型公司则根据Token消耗量进行收费。

理论上，token消耗量与AI交互成正比。你消耗越多，说明你与AI的交互越频繁。

听起来没毛病，英伟达CEO黄仁勋也是这么认为的。

3月下旬的英伟达GTC大会上，黄仁勋表示公司应该给每位工程师分配一笔token预算，金额约为基本工资的一半，让AI将他们的产出放大十倍。

后来他在All-In播客上又举了一个例子：

假设有一位年薪50万美元的工程师，年底问他今年花了多少token，如果没花到25万美元，黄仁勋会“ deeply alarmed ”，感到非常震惊。

如果他只花了5000美元呢？

黄仁勋会直接“I will go ape something else”，中文大概就是气得跳脚，当场发疯，骂你MD（最后一句我加的戏）。

在黄仁勋看来，优秀的工程师就应该大量使用AI，用得越多产出越高。

毕竟公司给你配置了AI资源，你利用资源提效，产出放大，如果你不用，确实说不过去。

这种逻辑不只黄仁勋一个人这么想。

2025年4月，Shopify CEO Tobi Lutke给全体员工发了一封备忘录：在申请增加人手之前，必须先证明AI无法完成这项工作，而AI的使用情况也要纳入绩效考核。

硅谷甚至出现了一个专门形容这种风气的词：Tokenmaxxing，即token最大化。

《纽约时报》科技记者Kevin Roose对此进行了专题报道，其中数据非常夸张：OpenAI有工程师一周处理了2100亿token，Anthropic有用户一个月在Claude Code上烧掉了15万美元。

而现在，这股风终于吹到了国内，企业们开始将token消耗、AI使用时长纳入绩效。。。

这不是闹着玩的。。。

和AI互动得多，不代表解决的问题就多。就像我们去健身房，去了100次体重不一定减少。

好，退一万步说：

就算我们暂时接受“用得多=产出高”这个前提。那么至少这个指标应该很难伪造吧？

恰恰相反，刷token，可能是2026年最容易的事。

差评君简单露两手，看完你就知道这个指标有多糟糕了。

第一种，上下文滚雪球式消耗。

为了保持上下文连贯，AI的每次回答都会从头重读之前的所有对话。对话越长，每轮重读消耗的token越多。第1轮只要1500个token，但到了第20轮、第50轮光重读就要烧掉几十万、百万token。

你就这么无限对话下去，就算被领导质疑，你就说：这是经过反复追问多轮才得到满意的结果。

懂不懂什么叫“深度思考”啊。

第二种，开启50个AI Agent（代理）让它自动执行任务。

Agent会自己派活、重试、遇到问题绕路，每个步骤都在烧token，思考过程也算钱，跑一晚上第二天你就是部门的劳模。

第三种更简单。

把整个10万行代码库扔给AI，让它“分析一下”就行，努力的样子从未如此省力。

其实这些方法一点都不高级，制定这条KPI的公司、管理层也不可能没预料到会被刷。

因为经济学有个概念叫Goodhart定律：当一个度量指标变成考核目标，它就不再是一个好指标。

它一定会被刷。

英国NHS曾经考核急诊等待时间不超过4小时，结果医院让救护车在门口停着不让病人下车，因为等待时间是从进门开始算的。

没有人觉得自己在作恶，每个人都在合理地优化自己面对的指标。

Token排行榜也一样。

它已经成了AI时代的功德箱，佛祖不看金额看诚意，领导不看产出看次数。

所以真正的问题来了：

为什么明知会被刷，这个指标还是出现了？

因为它的背后，是AI时代特有的、自上而下的焦虑。

过去两年，不拥抱AI就会被淘汰几乎成了科技圈的政治正确。CEO们在财报电话会上必须提到AI，投资人看的是AI渗透率，媒体写的是某公司全员接入大模型。

Meta 2026年绩效关注员工用AI做出多少成果

这种焦虑一层一层往下传导：

董事会问CEO“我们的AI战略是什么”，CEO问VP“AI落地进度怎么样”，完了VP又发条语音问总监“能不能给我一个数据证明大家在用”。

在这种氛围下，管理层不得不需要一种手段强推AI渗透。

可问题是，AI时代产出归因太模糊了。

代码行数、需求完成数、项目交付，现在说不清到底多少是AI贡献的。上头一问你AI渗透到什么程度，你直接哑火。

当真实贡献不可观测，管理者就只能抓最近的、可数的东西。

诶，token消耗量恰好是那个完美指标：可量化、可对比、可造假。

到这，你就能理解为什么token排行榜会出现在大厂里了，既能逼着员工用起来，又能拿去跟老板交差，当作一个向上汇报的数据，美滋滋。

当然了。。。

鉴于这次KPI提出者是BAT大厂管理层，也可能存在第二种原因。

你想想，“不用AI就会被淘汰”、“token消耗代表先进性”，这套行业叙事的最大受益者是谁？

BAT等大模型厂商，毕竟靠卖token赚钱，不过这就不在本文讨论范围内了。

差评君更关心的是，今年大厂能把token消耗纳入考核，小公司把AI使用时长加进日报。

那明年呢，你所在的公司呢？

我不是说AI没用，也不是说不该推AI。

的确，在AI应用早期阶段，强制接触有其合理性，历史上也有过“强推”的成功先例。

20世纪初，福特工厂强制流水线作业，工人强烈抵触，觉得这是剥夺手艺人的尊严，但流水线最终让汽车从富人玩具变成了普通家庭的交通工具。

组织一旦习惯了旧的做事方式，即使新工具明显更好，惯性也会让所有人赖在原地不动。

从企业角度来看，强推AI有组织变革的正当性。

可问题是，福特流水线和AI根本不一样啊。

福特是直接把生产方式换了，流水线往那一架，你作为工人没法再手搓了，这是从底层变革生产力。工人抵触归抵触，离职归离职，福特加工资把人留住，最后效率确实提上去了。

但AI不一样。

对互联网公司而言，AI没有在根本上替换他们的工具链。

员工用不用、怎么用，选择权还在自己手上。

AI要真能升效，用AI的人自然会在产出上胜出，大家自然会选择最高效的方式，不需要你拿排行榜逼。

如果所谓的token排行榜能度量员工的价值，那打字排行榜早就是诺贝尔文学奖的评选标准了。

写作的价值不在于你写了多少个字，思考的价值不在于你翻了多少页书，使用AI的价值也不在于你烧了多少token。

不要因为AI时代的焦虑，就把人的价值也一起烧掉了。

巴尔的摩街头的枪声没有因为数据变好看而消失，你公司的效率也不会因为token烧得多就一定提升。

撰文：刺猬

编辑：莽山烙铁头面线

责任编辑：杨赐

新浪财经声明：此消息系转载自合作媒体，新浪财经登载此文出于传递更多信息之目的，文章内容仅供参考，不构成投资建议。

郑重声明：1.根据《证券法》规定，禁止编造、传播虚假信息或者误导性信息，扰乱证券市场；2.用户在本社区发表的所有资料、言论等仅代表个人观点，与本网站立场无关，不对您构成任何投资建议。用户应基于自己的独立判断，自行决定证券投资并承担相应风险。

← 上一篇：AI专业深度解析：是“天坑”还是“风口”？课程、就业与读研全攻略下一篇：AI焦虑泛滥，谁在为经济担忧？ →