标签

AI招聘偏爱“自家”出品,求职者面临新挑战

发布时间:2026-04-28 10:05来源:微信阅读:5

去年春天,陈佳慧(Sarah Chen)向旧金山一家科技公司投递了一份市场岗位的简历。

她当时并不知道,第一个看她材料的根本不是人——一套AI筛选系统已经把她的申请归入了优先级较低的那一堆。不是因为她资历不够,而可能仅仅因为,她的简历是自己写的。

像她这样的人,不在少数。

越来越多的研究正在揭示AI驱动的招聘潮流中一个此前被忽视的问题:企业用来筛简历的算法,似乎系统性地偏爱AI写出来的申请材料——尤其偏爱和自己"同宗同源"的那款AI所生成的文本。

马里兰大学、新加坡国立大学和俄亥俄州立大学的联合研究团队于去年发表论文,目前完成最新修订。研究发现,如果求职者用来优化简历的大语言模型,恰好与雇主所用的筛选系统属于同一款,那么他被列入候选名单的概率,比提交手写简历的同等资历者高出23%到60%。

这一效应在销售、会计、金融等商业领域最为突出。

计算机科学界将这种现象称为"自偏好偏见"。在招聘场景中,它意味着AI筛选工具倾向于优先选择自己生成的内容,而非人类所写的版本——在各类商业和开源模型中,这一偏好率介于68%到92%之间,即便双方的实际资历完全相同。

更让研究者感到不安的是,这种偏见跟质量没有关系。同一团队请来18位人类评审员对简历进行比较,评审员一致认为人类手写的原版在清晰度和连贯性上更胜一筹——但AI筛选系统依然选择了自己的输出。

这种偏好本质上是风格层面的,而非能力层面的:算法在按照自己的样子选人。

论文作者直接点明,这是"一种新型算法不公平","让使用特定AI工具的人占据了优势,而其他人则因工具选择或获取渠道的差异而处于劣势"。

这项研究测试了目前最主流的七款大语言模型,包括GPT-4o、DeepSeek-V3、LLaMA 3.3-70B、Qwen 2.5-72B等,以ChatGPT广泛普及之前收集的2245份真实简历作为实验材料。研究者让每款模型改写简历的执行摘要,再让同一模型担任评审,模拟真实招聘的筛选过程。

几乎在每一组对比中,规律都保持一致。DeepSeek-V3在与LLaMA生成的简历对比时,有69%的情况选择了自己写的版本;GPT-4o对人类手写简历的自偏好率更超过了80%。

模型越大越强,偏见往往越明显——这个出乎意料的发现暗示,随着AI工具性能不断提升,问题可能只会越来越严重。

这份研究发表的时候,AI已经成为大多数企业招聘的默认第一道关卡。据估算,财富500强企业中有高达98.4%已将某种形式的AI引入招聘流程,涵盖简历初筛到自动化面试评分等各个环节。研究者所描述的AI对AI博弈,早已不是假设场景,而是数以百万计求职者每天正在经历的现实。

监管机构已经开始关注这一问题。科罗拉多州的AI法案将于2026年6月正式生效,届时将要求AI招聘工具的开发者和使用者采取合理措施,防止算法歧视。

纽约市已强制要求对自动化雇佣决策工具每年进行偏见审计;加利福尼亚州也于去年10月完成了相关法规的制定。

但对求职者来说,规则正在实时变化——而目前最稳妥的应对策略,可能是一个令人不舒服的选择:用AI的逻辑对抗AI。

马里兰研究发现,只需进行简单干预——比如提示AI评审忽略文本