标签

985硕博扎堆做标注,我们竟是AI的“人肉电池”?

发布时间:2026-04-25 17:57来源:微信阅读:5

AI要想透彻理解人类世界,离不开经过标注的数据,而那些收入颇丰的数据标注员,恰恰承担着这一关键职责。难道人类中最顶尖的那批年轻人,真的在协助AI,亲手葬送自己的未来?

恰逢我作为一名正经985毕业的“前浪”,决定去面试这些传说中月薪过万的数据标注岗位,带大家一同探究其中的虚实。

请收看36氪原创视频

👆🏻欢迎关注36氪视频号👆🏻

早九晚六,无加班,无需驻场

毕业起薪轻松过万

海投完简历后,我在一栋老旧写字楼见到了一位招聘负责人。她告知我应聘的是某大厂的外包岗,好处是不用真正挤进大厂“跳动心脏”。

早九晚六,不加班、不驻场,工作难度说不上难,但也谈不上简单。

在数据标注行业里,拉框、声纹、教AI识别猫狗、语音转文字……难度堪比“宝宝巴士”,主打便宜量大,有手就行。

国外科技巨头通常外包给菲律宾、肯尼亚人,国内的二三线城市也类似,属于“零工”或“AI扶贫”性质的工作。

而需要985、211毕业生参与的项目,难度则属于“速度与激情”级别。不仅要给AI当裁判,指出其生成内容的偏差,还得在专业领域内绞尽脑汁为AI出题。

问题清晰有条理只是基本功,且你出的题,主流模型通常只能答对40%,换言之,你要设法难住AI。所有努力都是为了把AI的回答从40分训练到80分,助其更深入理解人类模式,变得更聪明。

一位“文生文”项目负责人对这项工作做了更详细的阐述:

“我们需要给模型设定考点或参考答案,答对才能得分。当前大模型训练主要用check list(结构化评判标注),正逐步进化为rubric(评分标准)。若check list是60分参考答案,rubric可能是80甚至100分。因此培训期会投入大量时间,专门培训check list的书写方式。”

如此复杂的任务,底薪8000,绩效最高6000。大部分人能拿中间档3000元绩效,综合薪资也能超1万。

老实说,985文科刚毕业,1万多薪水确实有竞争力。负责人直接说我学历符合,可参与“试标”,通过7-10天培训和考核后即可入职。

给AI当老师批改作业

AI变聪明了,人却麻木了

接着,我们找到了在大厂外包岗工作半年的渊星进一步了解,作为科幻作者的他,加入的是小说组。

渊星主要工作是让模型写短篇小说。在特定测评中,他会针对同一指令让5个大模型回答,每个写一万字甚至更多,总数几万字。这些海量回答需标注员仔细审阅评估。

看大神写网文是一回事,看AI写的又是另一回事。

相当于老师改作文,不过五个学生都是AI。哪里有语病?逻辑结构有无问题?标签都得打好,还得选出最佳创作,自己上手给AI示范什么叫“人味儿”。这过程堪称折磨。

渊星的真实感受是:AI大部分写得都很烂。时间一长消耗巨大,旁人看来很AI的表达,他坦言已看不出区别:“上班期间我完全没创作欲望,每天看AI写的东西就很折磨。”

关键是折磨一通后,到手的钱也没想象中多。

因绩效与标注量挂钩,并非每条数据都能通过质检和算法检验。你觉得AI能得80分,质检觉得60分,数据需返修,量就难做起来。

给AI做“人肉电池”,消耗远超想象。无论985、211学历,还是大厂机会、AI机遇,这些光鲜标签都掩盖不了岗位处于AI产业链下游的事实。

渊星认为,标注员接触不到产品和算法。规则制定、任务下达由产品和项目经理对接,再传达给标注员。他直言:“就像项目经理高贵,标注员低级,不能同坐会议室。”

面试HR表示,做标注无非从一个项目跳到另一个,无晋升空间。但她认为“给AI打螺丝”太悲观,安慰道:“标注员像老师,模型是否变聪明、用户体感如何,源头都在于数据质量。”

只是,对一线标注员,“模型变聪明”与自己关系难感知。更多人像渊星,觉得在做无用功。

每一个人,

都在参与投喂AI的义务劳动

在加州工作的Jiayi有研究生学历,从事图像数据标注一年半,同样有困惑。

她表示目前工作完全不知道接触的数据训练有何后续影响:不知目标,不知服务于哪台机器,更不觉得能学到实用技能。

名校生精心标注的数据,对AI进化如聚沙成塔的一粒沙。AI建起从未有过的高塔,人类每粒沙都重要,但身处其中,沙子难看清自身于整体的意义。

高质量数据集是人工智能研究的核心。

“AI教母”李飞飞2009年推出ImageNet,1500万张图片,2.2万类别。帮她完成海量工作的,是亚马逊众包平台4.8万名零工。

对数据质量的强调让AI越来越聪明。给AI当“老师”的人也被层层筛选,卡学历只是开始。数据标注已从劳动密集型,变成门槛不断抬高的赛博流水线。

从一线升为项目经理的Leon透露,在大厂后期主要目标是利用自动化PE workflow agent实现自动评测或标注。

AI正在进化到自我训练,在这场轰轰烈烈硅基进化史中,再昂贵的碳基大脑,也注定是完成技术闭环的燃料。

实际上,使用AI的每一个人,都参与了这场投喂AI的义务劳动。

你与AI的每次对话,都可能成为数据标注员评测素材。AI接住你后,你的追问、纠正、选择,都在告诉它人类想要什么。

未来,我们和AI会互相引导走向何种终局?

没人知道。