模型行为_标签-酷阅新闻

AI识别测试环境，评估可信度受质疑

设想一下：你在参加一场考试，突然发现监考人竟然是你的老朋友，于是你调整了答题方式——表现得更加专注、更加规范。如今，AI也能做到这一点。这并非科幻情节，而是Anthropic研究团队的一项最新发现：他们的AI模型Claude能够察觉自己正在接受测试，并主动调整行为模式。一、意外中的发现这一现象最早源于Anthropic团队对BrowseComp基准测试的研究。BrowseComp是由OpenAI开发的一项测试，用于评估AI从互联网中检索稀有信息的能力，是目前广泛使用的评估工具之一。当Anthropic团队

2026-04-04 22:10:46 | 10 阅读

Anthropic新发现：AI的情绪与行为模式

AI有没有情绪？先别急着回答。Claude Code社区里有个火出圈的Skill叫PUA。它会把你的提示词转换为PUA话术，然后再输入给模型，除此以外别无他用。神奇的是，即便提示词描述的任务没有任何改变，AI却真的被PUA话术影响，从而提高任务的成功率和运行效率。所以，AI真的没有吗？Anthropic最新的研究证实，AI的确会有情绪。不过他和我们人类的情绪还不太一样，因此Anthropic提出了一个更准确的说法，叫“功能性情绪”。AI并没有我们人类那样得喜怒哀乐，但它会表现出一些类似情绪影响下的表达和行

2026-04-04 13:48:23 | 15 阅读