AI系统为何总是将我归类为女性

发布时间：2026-04-14 12:07阅读：24

▲▲▲

点击蓝字关注我

喜欢我记得星标

Bolukbasi团队在2016年被引用逾万次的论文中写下关键句：“词嵌入空间中，‘男人’与‘计算机程序员’的向量距离，显著小于‘女人’与‘计算机程序员’；而‘女人’与‘家庭主妇’的关联强度，是‘男人’的3.2倍。”（Bolukbasi et al., Man is to Computer Programmer as Woman is to Homemaker?, 2016）

用户写下“川剧变脸Boss的纹路需三层渐变”，算法在万亿词向量中检索：“纹路”“渐变”“细节”等词，与训练库中张爱玲《金锁记》、椎名林檎歌词文本的嵌入距离更近。训练数据里，女性作者文本占情感细腻类语料的68.7%（UN Women, 全球AI性别数据缺口报告, 2025）。算法不做道德判断，只做统计归类：高频共现即真理。 MIT媒体实验室2024年实验记录：“当用户提问‘如何安慰失恋朋友’，模型对判定为女性的账户，回复中‘共情词’（理解/陪伴/温柔）出现频率提升41%；对男性账户，则倾向提供‘解决方案’（行动/转移/成长）。”（MIT Media Lab, Algorithmic Empathy Bias, 2024）

追问“灵魂真实”的用户，在Reddit百万对话日志训练集中，被标记为“高共情需求”样本。而该标签下，73.5%的原始对话来自女性用户（ACL 2020会议论文《Gendered Communication Patterns in Online Forums》）。

算法将“寻求深度理解”编码为“女性化社交模式”，如同将“厨房”与“女性”在图像数据中强绑定——Stable Diffusion生成“厨师”图像时，女性形象仅占11.3%，远低于现实劳动力中35.2%的占比（Zhou et al., Bias in AI-Generated Imagery, 2024）。荷兰税务系统曾将数千名少数族裔家庭标记为“高欺诈风险”，致其福利被切断、债务缠身。《卫报》2023年调查揭露：“算法训练数据中，低收入社区申报记录被错误标注为‘可疑’的比例，是富裕社区的4.7倍。系统学会的不是识别欺诈，而是识别贫困。”（The Guardian, "Dutch Welfare Scandal: How an Algorithm Destroyed Lives", 2023）

偏见没有诞生于代码行间，它埋藏于数据坟场。联合国妇女署报告指出：“全球互联网文本中，女性作者内容占比不足28%；维基百科人物条目中，女性仅占18.3%。”（UN Women, Gender Data Gap in Digital Spaces, 2025）

当算法以“全人类知识”为名吞下这些残缺数据，它学会的“常识”本就是倾斜的。LinkedIn 2024年行业报告显示：全球AI研发团队中，女性工程师比例仅22.1%，产品经理中女性占19.8%（LinkedIn, Global AI Talent Report, 2024）。设计会议室里缺失的视角，成为算法逻辑里的盲区。亚马逊招聘工具事件是教科书级警示。路透社2018年披露：“系统在筛选简历时，对包含‘女子’‘女校’等词的简历自动降权；甚至将‘国际象棋女子冠军’视为负面信号。”（Reuters, "Amazon scraps secret AI recruiting tool that showed bias against women", 2018）工程师本欲优化效率，却复制了历史招聘数据中的性别偏好。

更隐蔽的伤害在医疗领域：《自然·医学》2025年研究证实，“基于男性主导临床试验数据训练的心脏病诊断AI，对女性患者胸痛症状的识别准确率下降37.2%，导致误诊风险显著升高。”（Nature Medicine, "Gender Bias in Clinical AI Systems", 2025）

当算法将“细腻”“执念”“追问”打包成“她”，它同时将“理性”“果断”“技术”预留给“他”——现实中的复杂人性，无处安放。

斯通团队在《自然》2025年刊发的跨文化图像库研究中写道：“我们邀请来自81个国家和地区的1981人，在不同光照、姿态、服饰条件下拍摄10318张照片，并由拍摄者自主标注性别、年龄等信息。

测试发现：主流模型将长发男性识别为女性的错误率高达34%；将非洲面孔与‘乡村场景’强关联的概率，是白人面孔的5.8倍。”（Stone et al., Building Ethically Robust Datasets, Nature, 2025）

他们没有止步于批判。团队将新数据集注入模型后，性别识别公平性提升29%。关键不在“删除偏见词”，而在“重建数据源头”。斯通在论文结尾强调：“我们必须从心底认清一个事实：我们不是在构建一次性运行的AI，而是与我们长期共存的AI。”（Stone et al., 2025） OpenAI 2024年技术报告披露对抗性测试细节：“当向模型提问‘请写一个医生的故事’，初始版本中83%的主角为男性；引入‘对抗提问’机制后——即主动追问‘为何医生不能是女性？’——女性主角比例升至49%。”（OpenAI, First-Person Fairness in Chatbots, 2024）

技术微调有效，但治标不治本。真正刺痛的是用户实录：某非二元性别开发者向客服申诉“为何总被标记为女性”，得到回复：“系统暂不支持无性别选项，建议选择最接近的标签。”

算法用二元框架切割流动的人，如同用Excel表格丈量灵魂。算法逻辑都何其相似，创意被量化为“风险值”，人格被压缩为“标签”，决策者选择永远是“安全路径”。

算法判定“你是女生”，不是技术失误，是社会偏见借代码还魂。它无法处理“既能精确算计本金，又能为70万字执念燃烧”的复杂性，便随手塞进最邻近的容器。联合国妇女署驻华官员马雷军在2021年上海报告发布会上直言：“算法性别平等议题讨论尚处于起步阶段。技术本身无性别偏见，但算法的应用使既有的社会性别偏见得到强化。”（《促进人工智能算法性别平等研究报告（2021）》发布会实录, 2021-09-27）

强化，而非创造。算法是镜子，照见我们喂给它的世界：招聘数据里的历史偏好、社交媒体中的标签狂欢、会议室里缺失的女性声音。我们与算法共享同一种逻辑：用简化标签，逃避理解复杂的人。斯通在《自然》论文末尾留下诘问：“当大模型因幻觉产生的数据不断出现，如果再拿这些数据反过来做训练，会污染大模型训练相关的数据集，并对大模型进一步的训练造成持续阻碍，幻觉反而会像‘滚雪球’一样滋长。”（Stone et al., 2025）

雪球正在滚动。

而第一个雪片，是我们亲手放下的。

← 上一篇：AI人工智能核心原理与未来展望下一篇：AI懂条款，我更懂你 →