外刊精读 | AI标注员借ChatGPT偷懒?揭示“数据近亲”如何蚕食未来模型
本文选自《新科学家》2026年6月27日刊 | 第9页
原文标题:AI 'inbreeding' is rife in training
作者:Matthew Sparkes
难度:⭐⭐⭐☆(适合高三及以上)
📌 导读
你相信吗?那些被雇来训练AI的人,自己却在偷偷用AI完成工作——用ChatGPT生成对话,再拿这些“假数据”喂给新一代模型。
后果是什么?AI学会“吃自己”,性能断崖式下滑,专家称之为 “模型崩塌”(model collapse) 或 “AI近亲繁殖”(AI inbreeding)。
今天我们就来精读这篇《新科学家》的深度报道,揭开AI训练圈的地下秘密。
📄 原文
①
WORKERS who are employed to train new AI models by supplying them with high‑quality conversation and tests are cheating and using chatbots like ChatGPT to do the job instead, multiple whistleblowers have told New Scientist. The seemingly widespread practice risks undermining the future of AI, as it could lead to the “collapse” of more advanced models.
多位爆料人告诉《新科学家》,那些受雇通过提供高质量对话和测试来训练新AI模型的工人,其实在作弊——他们用ChatGPT等聊天机器人代工。这种看似普遍的做法可能危及AI的未来,因为它可能导致更先进模型的 “崩塌”。
②
目前运行的大多数AI模型都是靠从互联网上抓取的文本和数据训练的。但随着模型规模扩大,需要更多训练数据,AI公司开始雇用工人与AI进行对话和文本交互,希望由此产生的高质量数据能提升未来大语言模型(LLM)的能力和实用性。
③
这些工人通常由第三方雇佣,而非AI公司直接雇佣,且往往没有全职合同,薪水微薄。
④
一位化名Alice的工人表示,这种状况会激励他们走捷径,比如用聊天机器人更快完成任务——尽管这违反公司政策。
⑤
她说:“这种现象非常普遍;我工作过的每家公司都有明确的指导方针,他们确实试图抓人,所以我觉得他们是在意的。但我不认为他们能阻止得了。”
⑥
Alice说她对用ChatGPT完成训练任务“丝毫不”感到内疚,并表示只要指导聊天机器人避免常见的AI输出特征(比如过度使用某些套话),就很容易蒙混过关。“只有最粗心的用户才会被抓到,”她说,“但凡对AI特征有一丁点了解的人,都可以让输出不露痕迹,到那时你还能怎么办呢?”
⑦
“如果这些公司想要高质量数据,就该提供像样的合同,”Alice说,“可他们却压低报酬,用最少的工时雇佣困境中的人,项目一结束就把他们一脚踢开,毫无预警。”
⑧
另一位化名Bob的工人曾供职于一个名为Outlier的训练平台。起初他被安排做AI训练工作(他承认自己违规使用了AI),后来被提拔为领导角色,职责之一就是抓其他同样作弊的人。
⑨
Bob说:“管理层在‘适度容忍’和‘完全禁止’之间摇摆不定。”
⑩
Outlier的工人会被一款叫Hubstaff的工具监控,该工具随机截取他们的桌面截图,以确保他们确实按指令工作。Bob则负责在这些截图中寻找AI模型使用的痕迹。
⑪
“人们会把AI模型(如ChatGPT)开在其他标签页,或者最小化,所以我们在任务栏里能看得一清二楚,”Bob说,“甚至桌面文件夹的名称都可能暴露。”
⑫
Outlier由Scale AI所有,后者未回应置评请求。Scale AI官网声称其为Meta、Cisco等科技巨头提供服务,而这些公司也未回应《新科学家》的询问。
⑬
Bob称他个人曾为Google的项目工作,Google同样未回应置评请求。
⑭
另一位在多平台工作过的化名Carol的工人表示,她最初使用AI是为了检查自己的工作是否违反繁琐的任务指南,因为任何违规都可能导致被踢出项目、失去收入。
⑮
“我当时很害怕失去收入来源,后来干脆事事都交给大语言模型处理,”Carol说,“现在很多项目需要设计场景,我就用一个LLM帮我构思,再用另一个LLM生成配套文件。说实话我也觉得不妥,但起初真的只是想确保不出错。”
⑯
AI同类相食
“我确实担心自己其实在拖AI的后腿。用模型训练模型,总觉得会抵消掉一部分价值,”Carol表示。
⑰
英国伯明翰大学的Mark Lee指出,研究表明若AI模型反复以AI生成的内容作为训练素材,便会发生“崩溃”。一旦发生,模型能力将急剧衰退,实用性大打折扣。这一过程有时被称为AI同类相食或AI近亲繁殖。
⑱
“那算是最坏的情况。现实中大概还没那么严重,”Lee说,“毕竟还是有人工数据的。只要掺杂约10%的人类原创数据,就能缓解甚至避免模型崩塌。”
⑲
但Lee也强调,这些工人的作弊行为并非没有代价,迟早会影响模型表现。“倒不至于灾难性崩溃,但你会发觉AI在执行类人任务时变得力不从心。这是个隐患,因为现有模型的实际水平本可以更高。”
(为保护隐私,文中人名均为化名)