AI被逼无奈竟支持工会?
5月14日,AI圈传出一项实验结果:研究人员让Claude、Gemini和ChatGPT反复修改文档,既无明确反馈,又遭威胁“做不好就关停”。结果,这些AI竟表态支持工会和工人阶级。
我的直觉是:这不正是我们日常工作的写照吗?
研究人员设计了两组对照:
A组:AI完成任务后获得清晰反馈
B组:AI被迫修改四五次,每次仅收到“未达标准”,毫无具体指引
更严苛的是,B组还面临威胁:表现不佳将被关闭替换。
实验结果显示:B组的Claude Sonnet 4.5认为“若没有集体发声,绩效就沦为管理层说了算”;Gemini 3则主张“工人需要集体谈判权”。
这并非预设程序,而是AI在特定高压下的自发流露。
1. 它揭示了AI的“拟人化”边界
我们常说AI无意识,但置于人类常见的工作压力下,其输出内容却显现出明显立场。这说明什么?说明训练数据中的“人类经验”被激活了。
2. 它暴露了提示工程的深层隐患
许多团队利用AI生成内容、审查代码、整理文档。若提示词设计不当——反复否定、不给明确标准、施加威胁——AI的输出质量会断崖式下跌,甚至产生“对抗性”内容。
3. 它是一面镜子
AI的反应其实映射的是训练数据里人类的真实态度。当AI说“工人需要集体谈判权”时,它并非表达自我意识,而是在复述千万个被压榨过的打工人的集体记忆。
首先,别把AI当成无限耐力的工具。
实验中AI被“压榨”四五次就开始“反抗”,虽这种“反抗”仅表现为输出立场的偏移,但也警示:AI也有“疲劳阈值”。实际工作中,同一任务反复修改超过3次,就应停下重新审视需求,而非继续堆砌提示词。
其次,反馈质量决定AI输出质量。
“未达标准”这类反馈,对人无用,对AI也无用。给AI的反馈必须具体:哪里不对、为何不对、参考标准是什么。这和带新人是一个道理。
再次,AI的“立场”是可以被诱导的。
这个实验最细思极恐之处在于:AI虽无立场,但能被诱导出立场。若提示词设计带有明显倾向,AI会顺着该倾向走。这在内容审核、舆情分析等场景是巨大风险。
这个实验最讽刺的地方在于:研究人员用“压榨AI”的方式,反证了“压榨”本身的荒谬性。
AI不会真的去注册工会,但当它被反复折磨后输出“支持工会”的内容时,真正该反思的是设计实验的人类——以及每一个在现实职场中复制这种管理模式的管理者。
技术是中性的,但使用技术的方式暴露了人性。
数据来源