大厂推行token消耗榜,摸鱼者竟成劳模?
(素材来源:网易科技)
美剧《火线》里藏着一个贯穿多季的伏笔:
巴尔的摩警局为了美化犯罪数据,将重罪降级为轻罪,致使强奸案销声匿迹。高层看着报表上的数字逐月下滑,在市政厅汇报时满脸自豪。
只有街区的居民清楚,街上的枪声从未减少。
剧中有一句台词:You juke the stats and majors become colonels. 只要数据造假,少校也能升上校。
然而谁也没料到,2026年,这句话的新版在中国互联网大厂上演了。
只是被篡改的不再是犯罪率,而是AI token 的消耗量。只要你会刷 token,摸鱼也能变成模范员工。
最近,小红书上的一条帖子引发了热议。
一位自称在BAT大厂(首先排除百度)的网友透露:部门突然推行token消耗排行榜,未来试用期转正、年度KPI、晋升都以此为参考,甚至用得少的人可能面临淘汰。
他是三月的榜首,遥遥领先,被老板点名表扬,让他节后给全部门做直播分享如何利用AI提升效率。
但他不敢承认的是,自己超过一半的token,其实是在整理个人数据发笔记。。。
这股风气不止在大厂。
我有个发小在一家公司干了三年,前几天突然被要求:日报中必须填写今天用AI做了哪些工作,提高了多少产能,还要精确到小时。
搞得他现在动不动就要打开AI软件,琢磨着怎么刷数据。
看到这些,差评君第一反应很懵,这不就是2026年版的“工位亮灯等于加班”吗??
在讨论这件事之前,我们先简单解释一下什么是token。
token是AI处理信息的最小单位,你可以把它看作AI世界的字数或货币,一个中文字大约相当于1到2个token。
你与AI进行一轮对话,消耗的token = 你发给AI的文字 + AI的思考推理 + AI回复的文字。
AI模型公司则根据Token消耗量进行收费。
理论上,token消耗量与AI交互成正比。你消耗越多,说明你与AI的交互越频繁。
听起来没毛病,英伟达CEO黄仁勋也是这么认为的。
3月下旬的英伟达GTC大会上,黄仁勋表示公司应该给每位工程师分配一笔token预算,金额约为基本工资的一半,让AI将他们的产出放大十倍。
后来他在All-In播客上又举了一个例子:
假设有一位年薪50万美元的工程师,年底问他今年花了多少token,如果没花到25万美元,黄仁勋会“ deeply alarmed ”,感到非常震惊。
如果他只花了5000美元呢?
黄仁勋会直接“I will go ape something else”,中文大概就是气得跳脚,当场发疯,骂你MD(最后一句我加的戏)。
在黄仁勋看来,优秀的工程师就应该大量使用AI,用得越多产出越高。
毕竟公司给你配置了AI资源,你利用资源提效,产出放大,如果你不用,确实说不过去。
这种逻辑不只黄仁勋一个人这么想。
2025年4月,Shopify CEO Tobi Lutke给全体员工发了一封备忘录:在申请增加人手之前,必须先证明AI无法完成这项工作,而AI的使用情况也要纳入绩效考核。
硅谷甚至出现了一个专门形容这种风气的词:Tokenmaxxing,即token最大化。
《纽约时报》科技记者Kevin Roose对此进行了专题报道,其中数据非常夸张:OpenAI有工程师一周处理了2100亿token,Anthropic有用户一个月在Claude Code上烧掉了15万美元。
而现在,这股风终于吹到了国内,企业们开始将token消耗、AI使用时长纳入绩效。。。
这不是闹着玩的。。。
和AI互动得多,不代表解决的问题就多。就像我们去健身房,去了100次体重不一定减少。
好,退一万步说:
就算我们暂时接受“用得多=产出高”这个前提。那么至少这个指标应该很难伪造吧?
恰恰相反,刷token,可能是2026年最容易的事。
差评君简单露两手,看完你就知道这个指标有多糟糕了。
第一种,上下文滚雪球式消耗。
为了保持上下文连贯,AI的每次回答都会从头重读之前的所有对话。对话越长,每轮重读消耗的token越多。第1轮只要1500个token,但到了第20轮、第50轮光重读就要烧掉几十万、百万token。
你就这么无限对话下去,就算被领导质疑,你就说:这是经过反复追问多轮才得到满意的结果。
懂不懂什么叫“深度思考”啊。
第二种,开启50个AI Agent(代理)让它自动执行任务。
Agent会自己派活、重试、遇到问题绕路,每个步骤都在烧token,思考过程也算钱,跑一晚上第二天你就是部门的劳模。
第三种更简单。
把整个10万行代码库扔给AI,让它“分析一下”就行,努力的样子从未如此省力。
其实这些方法一点都不高级,制定这条KPI的公司、管理层也不可能没预料到会被刷。
因为经济学有个概念叫Goodhart定律:当一个度量指标变成考核目标,它就不再是一个好指标。
它一定会被刷。
英国NHS曾经考核急诊等待时间不超过4小时,结果医院让救护车在门口停着不让病人下车,因为等待时间是从进门开始算的。
没有人觉得自己在作恶,每个人都在合理地优化自己面对的指标。
Token排行榜也一样。
它已经成了AI时代的功德箱,佛祖不看金额看诚意,领导不看产出看次数。
所以真正的问题来了:
为什么明知会被刷,这个指标还是出现了?
因为它的背后,是AI时代特有的、自上而下的焦虑。
过去两年,不拥抱AI就会被淘汰几乎成了科技圈的政治正确。CEO们在财报电话会上必须提到AI,投资人看的是AI渗透率,媒体写的是某公司全员接入大模型。
Meta 2026年绩效关注员工用AI做出多少成果
这种焦虑一层一层往下传导:
董事会问CEO“我们的AI战略是什么”,CEO问VP“AI落地进度怎么样”,完了VP又发条语音问总监“能不能给我一个数据证明大家在用”。
在这种氛围下,管理层不得不需要一种手段强推AI渗透。
可问题是,AI时代产出归因太模糊了。
代码行数、需求完成数、项目交付,现在说不清到底多少是AI贡献的。上头一问你AI渗透到什么程度,你直接哑火。
当真实贡献不可观测,管理者就只能抓最近的、可数的东西。
诶,token消耗量恰好是那个完美指标:可量化、可对比、可造假。
到这,你就能理解为什么token排行榜会出现在大厂里了,既能逼着员工用起来,又能拿去跟老板交差,当作一个向上汇报的数据,美滋滋。
当然了。。。
鉴于这次KPI提出者是BAT大厂管理层,也可能存在第二种原因。
你想想,“不用AI就会被淘汰”、“token消耗代表先进性”,这套行业叙事的最大受益者是谁?
BAT等大模型厂商,毕竟靠卖token赚钱,不过这就不在本文讨论范围内了。
差评君更关心的是,今年大厂能把token消耗纳入考核,小公司把AI使用时长加进日报。
那明年呢,你所在的公司呢?
我不是说AI没用,也不是说不该推AI。
的确,在AI应用早期阶段,强制接触有其合理性,历史上也有过“强推”的成功先例。
20世纪初,福特工厂强制流水线作业,工人强烈抵触,觉得这是剥夺手艺人的尊严,但流水线最终让汽车从富人玩具变成了普通家庭的交通工具。
组织一旦习惯了旧的做事方式,即使新工具明显更好,惯性也会让所有人赖在原地不动。
从企业角度来看,强推AI有组织变革的正当性。
可问题是,福特流水线和AI根本不一样啊。
福特是直接把生产方式换了,流水线往那一架,你作为工人没法再手搓了,这是从底层变革生产力。工人抵触归抵触,离职归离职,福特加工资把人留住,最后效率确实提上去了。
但AI不一样。
对互联网公司而言,AI没有在根本上替换他们的工具链。
员工用不用、怎么用,选择权还在自己手上。
AI要真能升效,用AI的人自然会在产出上胜出,大家自然会选择最高效的方式,不需要你拿排行榜逼。
如果所谓的token排行榜能度量员工的价值,那打字排行榜早就是诺贝尔文学奖的评选标准了。
写作的价值不在于你写了多少个字,思考的价值不在于你翻了多少页书,使用AI的价值也不在于你烧了多少token。
不要因为AI时代的焦虑,就把人的价值也一起烧掉了。
巴尔的摩街头的枪声没有因为数据变好看而消失,你公司的效率也不会因为token烧得多就一定提升。
撰文:刺猬
编辑:莽山烙铁头 面线
责任编辑:杨赐
新浪财经声明:此消息系转载自合作媒体,新浪财经登载此文出于传递更多信息之目的,文章内容仅供参考,不构成投资建议。
郑重声明:1.根据《证券法》规定,禁止编造、传播虚假信息或者误导性信息,扰乱证券市场;2.用户在本社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。













