标签

大模型社交智商试金石!杜克与斯坦福:Connections揭示AI心智理论致命缺陷

本文深度剖析杜克大学&斯坦福大学合作论文《Improvisational Games as a Benchmark for Social Intelligence of AI Agents》,首次将即兴文字游戏Connections确立为AI社交智能的权威标尺。与传统纯理性评测不同,该游戏精准刺中大模型的核心软肋:推断他人认知范畴、多智能体协同博弈、实时调适社交情境。GPT-4o多智能体实测结果确凿:当下LLM推理虽臻满分,社交智能尚不及格!大语言模型的能力疆域正持续拓展:MMLU刷题登峰造极、代

2026-06-19 16:31:27  |  2 阅读