985硕博扎堆做标注,我们竟是AI的“人肉电池”?
AI要想透彻理解人类世界,离不开经过标注的数据,而那些收入颇丰的数据标注员,恰恰承担着这一关键职责。难道人类中最顶尖的那批年轻人,真的在协助AI,亲手葬送自己的未来?
恰逢我作为一名正经985毕业的“前浪”,决定去面试这些传说中月薪过万的数据标注岗位,带大家一同探究其中的虚实。
请收看36氪原创视频
👆🏻欢迎关注36氪视频号👆🏻
早九晚六,无加班,无需驻场
毕业起薪轻松过万
海投完简历后,我在一栋老旧写字楼见到了一位招聘负责人。她告知我应聘的是某大厂的外包岗,好处是不用真正挤进大厂“跳动心脏”。
早九晚六,不加班、不驻场,工作难度说不上难,但也谈不上简单。
在数据标注行业里,拉框、声纹、教AI识别猫狗、语音转文字……难度堪比“宝宝巴士”,主打便宜量大,有手就行。
国外科技巨头通常外包给菲律宾、肯尼亚人,国内的二三线城市也类似,属于“零工”或“AI扶贫”性质的工作。
而需要985、211毕业生参与的项目,难度则属于“速度与激情”级别。不仅要给AI当裁判,指出其生成内容的偏差,还得在专业领域内绞尽脑汁为AI出题。
问题清晰有条理只是基本功,且你出的题,主流模型通常只能答对40%,换言之,你要设法难住AI。所有努力都是为了把AI的回答从40分训练到80分,助其更深入理解人类模式,变得更聪明。
一位“文生文”项目负责人对这项工作做了更详细的阐述:
“我们需要给模型设定考点或参考答案,答对才能得分。当前大模型训练主要用check list(结构化评判标注),正逐步进化为rubric(评分标准)。若check list是60分参考答案,rubric可能是80甚至100分。因此培训期会投入大量时间,专门培训check list的书写方式。”
如此复杂的任务,底薪8000,绩效最高6000。大部分人能拿中间档3000元绩效,综合薪资也能超1万。
老实说,985文科刚毕业,1万多薪水确实有竞争力。负责人直接说我学历符合,可参与“试标”,通过7-10天培训和考核后即可入职。
给AI当老师批改作业
AI变聪明了,人却麻木了
接着,我们找到了在大厂外包岗工作半年的渊星进一步了解,作为科幻作者的他,加入的是小说组。
渊星主要工作是让模型写短篇小说。在特定测评中,他会针对同一指令让5个大模型回答,每个写一万字甚至更多,总数几万字。这些海量回答需标注员仔细审阅评估。
看大神写网文是一回事,看AI写的又是另一回事。
相当于老师改作文,不过五个学生都是AI。哪里有语病?逻辑结构有无问题?标签都得打好,还得选出最佳创作,自己上手给AI示范什么叫“人味儿”。这过程堪称折磨。
渊星的真实感受是:AI大部分写得都很烂。时间一长消耗巨大,旁人看来很AI的表达,他坦言已看不出区别:“上班期间我完全没创作欲望,每天看AI写的东西就很折磨。”
关键是折磨一通后,到手的钱也没想象中多。
因绩效与标注量挂钩,并非每条数据都能通过质检和算法检验。你觉得AI能得80分,质检觉得60分,数据需返修,量就难做起来。
给AI做“人肉电池”,消耗远超想象。无论985、211学历,还是大厂机会、AI机遇,这些光鲜标签都掩盖不了岗位处于AI产业链下游的事实。
渊星认为,标注员接触不到产品和算法。规则制定、任务下达由产品和项目经理对接,再传达给标注员。他直言:“就像项目经理高贵,标注员低级,不能同坐会议室。”
面试HR表示,做标注无非从一个项目跳到另一个,无晋升空间。但她认为“给AI打螺丝”太悲观,安慰道:“标注员像老师,模型是否变聪明、用户体感如何,源头都在于数据质量。”
只是,对一线标注员,“模型变聪明”与自己关系难感知。更多人像渊星,觉得在做无用功。
每一个人,
都在参与投喂AI的义务劳动
在加州工作的Jiayi有研究生学历,从事图像数据标注一年半,同样有困惑。
她表示目前工作完全不知道接触的数据训练有何后续影响:不知目标,不知服务于哪台机器,更不觉得能学到实用技能。
名校生精心标注的数据,对AI进化如聚沙成塔的一粒沙。AI建起从未有过的高塔,人类每粒沙都重要,但身处其中,沙子难看清自身于整体的意义。
高质量数据集是人工智能研究的核心。
“AI教母”李飞飞2009年推出ImageNet,1500万张图片,2.2万类别。帮她完成海量工作的,是亚马逊众包平台4.8万名零工。
对数据质量的强调让AI越来越聪明。给AI当“老师”的人也被层层筛选,卡学历只是开始。数据标注已从劳动密集型,变成门槛不断抬高的赛博流水线。
从一线升为项目经理的Leon透露,在大厂后期主要目标是利用自动化PE workflow agent实现自动评测或标注。
AI正在进化到自我训练,在这场轰轰烈烈硅基进化史中,再昂贵的碳基大脑,也注定是完成技术闭环的燃料。
实际上,使用AI的每一个人,都参与了这场投喂AI的义务劳动。
你与AI的每次对话,都可能成为数据标注员评测素材。AI接住你后,你的追问、纠正、选择,都在告诉它人类想要什么。
未来,我们和AI会互相引导走向何种终局?
没人知道。