标签

AI系统为何总是将我归类为女性

发布时间:2026-04-14 12:07来源:微信阅读:4

▲▲▲

点击蓝字关注我

喜欢我 记得星标

Bolukbasi团队在2016年被引用逾万次的论文中写下关键句:“词嵌入空间中,‘男人’与‘计算机程序员’的向量距离,显著小于‘女人’与‘计算机程序员’;而‘女人’与‘家庭主妇’的关联强度,是‘男人’的3.2倍。”(Bolukbasi et al., Man is to Computer Programmer as Woman is to Homemaker?, 2016)

用户写下“川剧变脸Boss的纹路需三层渐变”,算法在万亿词向量中检索:“纹路”“渐变”“细节”等词,与训练库中张爱玲《金锁记》、椎名林檎歌词文本的嵌入距离更近。训练数据里,女性作者文本占情感细腻类语料的68.7%(UN Women, 全球AI性别数据缺口报告, 2025)。算法不做道德判断,只做统计归类:高频共现即真理。 MIT媒体实验室2024年实验记录:“当用户提问‘如何安慰失恋朋友’,模型对判定为女性的账户,回复中‘共情词’(理解/陪伴/温柔)出现频率提升41%;对男性账户,则倾向提供‘解决方案’(行动/转移/成长)。”(MIT Media Lab, Algorithmic Empathy Bias, 2024)

追问“灵魂真实”的用户,在Reddit百万对话日志训练集中,被标记为“高共情需求”样本。而该标签下,73.5%的原始对话来自女性用户(ACL 2020会议论文《Gendered Communication Patterns in Online Forums》)。

算法将“寻求深度理解”编码为“女性化社交模式”,如同将“厨房”与“女性”在图像数据中强绑定——Stable Diffusion生成“厨师”图像时,女性形象仅占11.3%,远低于现实劳动力中35.2%的占比(Zhou et al., Bias in AI-Generated Imagery, 2024)。 荷兰税务系统曾将数千名少数族裔家庭标记为“高欺诈风险”,致其福利被切断、债务缠身。《卫报》2023年调查揭露:“算法训练数据中,低收入社区申报记录被错误标注为‘可疑’的比例,是富裕社区的4.7倍。系统学会的不是识别欺诈,而是识别贫困。”(The Guardian, "Dutch Welfare Scandal: How an Algorithm Destroyed Lives", 2023)

偏见没有诞生于代码行间,它埋藏于数据坟场。联合国妇女署报告指出:“全球互联网文本中,女性作者内容占比不足28%;维基百科人物条目中,女性仅占18.3%。”(UN Women, Gender Data Gap in Digital Spaces, 2025)

当算法以“全人类知识”为名吞下这些残缺数据,它学会的“常识”本就是倾斜的。LinkedIn 2024年行业报告显示:全球AI研发团队中,女性工程师比例仅22.1%,产品经理中女性占19.8%(LinkedIn, Global AI Talent Report, 2024)。设计会议室里缺失的视角,成为算法逻辑里的盲区。 亚马逊招聘工具事件是教科书级警示。路透社2018年披露:“系统在筛选简历时,对包含‘女子’‘女校’等词的简历自动降权;甚至将‘国际象棋女子冠军’视为负面信号。”(Reuters, "Amazon scraps secret AI recruiting tool that showed bias against women", 2018)工程师本欲优化效率,却复制了历史招聘数据中的性别偏好。

更隐蔽的伤害在医疗领域:《自然·医学》2025年研究证实,“基于男性主导临床试验数据训练的心脏病诊断AI,对女性患者胸痛症状的识别准确率下降37.2%,导致误诊风险显著升高。”(Nature Medicine, "Gender Bias in Clinical AI Systems", 2025)

当算法将“细腻”“执念”“追问”打包成“她”,它同时将“理性”“果断”“技术”预留给“他”——现实中的复杂人性,无处安放。

斯通团队在《自然》2025年刊发的跨文化图像库研究中写道:“我们邀请来自81个国家和地区的1981人,在不同光照、姿态、服饰条件下拍摄10318张照片,并由拍摄者自主标注性别、年龄等信息。

测试发现:主流模型将长发男性识别为女性的错误率高达34%;将非洲面孔与‘乡村场景’强关联的概率,是白人面孔的5.8倍。”(Stone et al., Building Ethically Robust Datasets, Nature, 2025)

他们没有止步于批判。团队将新数据集注入模型后,性别识别公平性提升29%。关键不在“删除偏见词”,而在“重建数据源头”。斯通在论文结尾强调:“我们必须从心底认清一个事实:我们不是在构建一次性运行的AI,而是与我们长期共存的AI。”(Stone et al., 2025) OpenAI 2024年技术报告披露对抗性测试细节:“当向模型提问‘请写一个医生的故事’,初始版本中83%的主角为男性;引入‘对抗提问’机制后——即主动追问‘为何医生不能是女性?’——女性主角比例升至49%。”(OpenAI, First-Person Fairness in Chatbots, 2024)

技术微调有效,但治标不治本。真正刺痛的是用户实录:某非二元性别开发者向客服申诉“为何总被标记为女性”,得到回复:“系统暂不支持无性别选项,建议选择最接近的标签。”

算法用二元框架切割流动的人,如同用Excel表格丈量灵魂。 算法逻辑都何其相似,创意被量化为“风险值”,人格被压缩为“标签”,决策者选择永远是“安全路径”。

算法判定“你是女生”,不是技术失误,是社会偏见借代码还魂。它无法处理“既能精确算计本金,又能为70万字执念燃烧”的复杂性,便随手塞进最邻近的容器。 联合国妇女署驻华官员马雷军在2021年上海报告发布会上直言:“算法性别平等议题讨论尚处于起步阶段。技术本身无性别偏见,但算法的应用使既有的社会性别偏见得到强化。”(《促进人工智能算法性别平等研究报告(2021)》发布会实录, 2021-09-27)

强化,而非创造。算法是镜子,照见我们喂给它的世界:招聘数据里的历史偏好、社交媒体中的标签狂欢、会议室里缺失的女性声音。我们与算法共享同一种逻辑:用简化标签,逃避理解复杂的人。 斯通在《自然》论文末尾留下诘问:“当大模型因幻觉产生的数据不断出现,如果再拿这些数据反过来做训练,会污染大模型训练相关的数据集,并对大模型进一步的训练造成持续阻碍,幻觉反而会像‘滚雪球’一样滋长。”(Stone et al., 2025)

雪球正在滚动。

而第一个雪片,是我们亲手放下的。