OpenAI 揭秘模型沉迷“哥布林”背后的隐患
有时,大模型的故障并非体现为评测分数骤降,亦非训练曲线出现醒目的红线。它或许仅仅是莫名开始频繁使用某个特定词汇,例如“哥布林”。OpenAI 在其发布的文章《Where the goblins came from》中,复盘了一个看似荒诞实则严峻的模型行为异常:自 GPT-5.1 版本起,模型愈发热衷于在回复中提及哥布林、捣蛋鬼等“小生物”意象。起初,这看似无关痛痒,“小哥布林”的提及或许仅显俏皮可爱。然而历经数个版本迭代,OpenAI 意识到这些“小生物”已形成群体性涌现。核心疑问随之产生:它们的源头究竟