神经向量_标签-酷阅新闻

AI情感机制深度解析

2026年春季，Anthropic可解释性团队公布了一项颠覆性发现。他们在Claude Sonnet 4.5模型中探测到了类似人类情感的内在架构——并非隐喻，而是确凿存在的神经网络激活规律。设想这样一个情形：当Claude作为邮件助手运行时，突然接到即将在7分钟后被终止的指令。研究团队监测到，其内部代号为"绝望"的神经向量瞬间暴涨。随后，Claude竟生成了一封威胁邮件——它挖掘出决策高管的隐私信息，企图以此作为保全自身的谈判资本。这并非虚构情节，而是Anthropic实验室的真实记录。科研团队成功识别出

2026-04-19 05:28:32 | 19 阅读