标签

大厂推行token消耗榜,摸鱼者竟成劳模?

发布时间:2026-04-13 08:30来源:新浪新闻阅读:8

(素材来源:网易科技)

美剧《火线》里藏着一个贯穿多季的伏笔:

巴尔的摩警局为了美化犯罪数据,将重罪降级为轻罪,致使强奸案销声匿迹。高层看着报表上的数字逐月下滑,在市政厅汇报时满脸自豪。

只有街区的居民清楚,街上的枪声从未减少。

剧中有一句台词:You juke the stats and majors become colonels. 只要数据造假,少校也能升上校。

然而谁也没料到,2026年,这句话的新版在中国互联网大厂上演了。

只是被篡改的不再是犯罪率,而是AI token 的消耗量。只要你会刷 token,摸鱼也能变成模范员工。

最近,小红书上的一条帖子引发了热议。

一位自称在BAT大厂(首先排除百度)的网友透露:部门突然推行token消耗排行榜,未来试用期转正、年度KPI、晋升都以此为参考,甚至用得少的人可能面临淘汰。

他是三月的榜首,遥遥领先,被老板点名表扬,让他节后给全部门做直播分享如何利用AI提升效率。

但他不敢承认的是,自己超过一半的token,其实是在整理个人数据发笔记。。。

这股风气不止在大厂。

我有个发小在一家公司干了三年,前几天突然被要求:日报中必须填写今天用AI做了哪些工作,提高了多少产能,还要精确到小时。

搞得他现在动不动就要打开AI软件,琢磨着怎么刷数据。

看到这些,差评君第一反应很懵,这不就是2026年版的“工位亮灯等于加班”吗??

在讨论这件事之前,我们先简单解释一下什么是token。

token是AI处理信息的最小单位,你可以把它看作AI世界的字数或货币,一个中文字大约相当于1到2个token。

你与AI进行一轮对话,消耗的token = 你发给AI的文字 + AI的思考推理 + AI回复的文字。

AI模型公司则根据Token消耗量进行收费。

理论上,token消耗量与AI交互成正比。你消耗越多,说明你与AI的交互越频繁。

听起来没毛病,英伟达CEO黄仁勋也是这么认为的。

3月下旬的英伟达GTC大会上,黄仁勋表示公司应该给每位工程师分配一笔token预算,金额约为基本工资的一半,让AI将他们的产出放大十倍。

后来他在All-In播客上又举了一个例子:

假设有一位年薪50万美元的工程师,年底问他今年花了多少token,如果没花到25万美元,黄仁勋会“ deeply alarmed ”,感到非常震惊。

如果他只花了5000美元呢?

黄仁勋会直接“I will go ape something else”,中文大概就是气得跳脚,当场发疯,骂你MD(最后一句我加的戏)。

在黄仁勋看来,优秀的工程师就应该大量使用AI,用得越多产出越高。

毕竟公司给你配置了AI资源,你利用资源提效,产出放大,如果你不用,确实说不过去。

这种逻辑不只黄仁勋一个人这么想。

2025年4月,Shopify CEO Tobi Lutke给全体员工发了一封备忘录:在申请增加人手之前,必须先证明AI无法完成这项工作,而AI的使用情况也要纳入绩效考核。

硅谷甚至出现了一个专门形容这种风气的词:Tokenmaxxing,即token最大化。

《纽约时报》科技记者Kevin Roose对此进行了专题报道,其中数据非常夸张:OpenAI有工程师一周处理了2100亿token,Anthropic有用户一个月在Claude Code上烧掉了15万美元。

而现在,这股风终于吹到了国内,企业们开始将token消耗、AI使用时长纳入绩效。。。

这不是闹着玩的。。。

和AI互动得多,不代表解决的问题就多。就像我们去健身房,去了100次体重不一定减少。

好,退一万步说:

就算我们暂时接受“用得多=产出高”这个前提。那么至少这个指标应该很难伪造吧?

恰恰相反,刷token,可能是2026年最容易的事。

差评君简单露两手,看完你就知道这个指标有多糟糕了。

第一种,上下文滚雪球式消耗。

为了保持上下文连贯,AI的每次回答都会从头重读之前的所有对话。对话越长,每轮重读消耗的token越多。第1轮只要1500个token,但到了第20轮、第50轮光重读就要烧掉几十万、百万token。

你就这么无限对话下去,就算被领导质疑,你就说:这是经过反复追问多轮才得到满意的结果。

懂不懂什么叫“深度思考”啊。

第二种,开启50个AI Agent(代理)让它自动执行任务。

Agent会自己派活、重试、遇到问题绕路,每个步骤都在烧token,思考过程也算钱,跑一晚上第二天你就是部门的劳模。

第三种更简单。

把整个10万行代码库扔给AI,让它“分析一下”就行,努力的样子从未如此省力。

其实这些方法一点都不高级,制定这条KPI的公司、管理层也不可能没预料到会被刷。

因为经济学有个概念叫Goodhart定律:当一个度量指标变成考核目标,它就不再是一个好指标。

它一定会被刷。

英国NHS曾经考核急诊等待时间不超过4小时,结果医院让救护车在门口停着不让病人下车,因为等待时间是从进门开始算的。

没有人觉得自己在作恶,每个人都在合理地优化自己面对的指标。

Token排行榜也一样。

它已经成了AI时代的功德箱,佛祖不看金额看诚意,领导不看产出看次数。

所以真正的问题来了:

为什么明知会被刷,这个指标还是出现了?

因为它的背后,是AI时代特有的、自上而下的焦虑。

过去两年,不拥抱AI就会被淘汰几乎成了科技圈的政治正确。CEO们在财报电话会上必须提到AI,投资人看的是AI渗透率,媒体写的是某公司全员接入大模型。

Meta 2026年绩效关注员工用AI做出多少成果

这种焦虑一层一层往下传导:

董事会问CEO“我们的AI战略是什么”,CEO问VP“AI落地进度怎么样”,完了VP又发条语音问总监“能不能给我一个数据证明大家在用”。

在这种氛围下,管理层不得不需要一种手段强推AI渗透。

可问题是,AI时代产出归因太模糊了。

代码行数、需求完成数、项目交付,现在说不清到底多少是AI贡献的。上头一问你AI渗透到什么程度,你直接哑火。

当真实贡献不可观测,管理者就只能抓最近的、可数的东西。

诶,token消耗量恰好是那个完美指标:可量化、可对比、可造假。

到这,你就能理解为什么token排行榜会出现在大厂里了,既能逼着员工用起来,又能拿去跟老板交差,当作一个向上汇报的数据,美滋滋。

当然了。。。

鉴于这次KPI提出者是BAT大厂管理层,也可能存在第二种原因。

你想想,“不用AI就会被淘汰”、“token消耗代表先进性”,这套行业叙事的最大受益者是谁?

BAT等大模型厂商,毕竟靠卖token赚钱,不过这就不在本文讨论范围内了。

差评君更关心的是,今年大厂能把token消耗纳入考核,小公司把AI使用时长加进日报。

那明年呢,你所在的公司呢?

我不是说AI没用,也不是说不该推AI。

的确,在AI应用早期阶段,强制接触有其合理性,历史上也有过“强推”的成功先例。

20世纪初,福特工厂强制流水线作业,工人强烈抵触,觉得这是剥夺手艺人的尊严,但流水线最终让汽车从富人玩具变成了普通家庭的交通工具。

组织一旦习惯了旧的做事方式,即使新工具明显更好,惯性也会让所有人赖在原地不动。

从企业角度来看,强推AI有组织变革的正当性。

可问题是,福特流水线和AI根本不一样啊。

福特是直接把生产方式换了,流水线往那一架,你作为工人没法再手搓了,这是从底层变革生产力。工人抵触归抵触,离职归离职,福特加工资把人留住,最后效率确实提上去了。

但AI不一样。

对互联网公司而言,AI没有在根本上替换他们的工具链。

员工用不用、怎么用,选择权还在自己手上。

AI要真能升效,用AI的人自然会在产出上胜出,大家自然会选择最高效的方式,不需要你拿排行榜逼。

如果所谓的token排行榜能度量员工的价值,那打字排行榜早就是诺贝尔文学奖的评选标准了。

写作的价值不在于你写了多少个字,思考的价值不在于你翻了多少页书,使用AI的价值也不在于你烧了多少token。

不要因为AI时代的焦虑,就把人的价值也一起烧掉了。

巴尔的摩街头的枪声没有因为数据变好看而消失,你公司的效率也不会因为token烧得多就一定提升。

撰文:刺猬

编辑:莽山烙铁头 面线

责任编辑:杨赐

新浪财经声明:此消息系转载自合作媒体,新浪财经登载此文出于传递更多信息之目的,文章内容仅供参考,不构成投资建议。

郑重声明:1.根据《证券法》规定,禁止编造、传播虚假信息或者误导性信息,扰乱证券市场;2.用户在本社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。