Anthropic创始人向教皇坦白AI的激励机制缺陷
昨天发生了一件相当魔幻的事情。Anthropic 联合创始人 Chris Olah 站在梵蒂冈,面对教皇 Leo XIV,说了一句大实话:每一家顶尖 AI 实验室,包括 Anthropic 在内,都在一套激励体系中运行,这套机制有时会与做正确的事相冲突。这句话出自一家估值高达 600 亿美元的公司创始人之口,对一位教皇所说,地点是梵蒂冈。很难想象还有比这更奇怪的组合。先说背景。教皇 Leo XIV 是天主教历史上第一位美国出生的教皇,去年 5 月当选。他上任后做的第一件大事,就是花了将近一年时间发布了一份