标签

AI论文速递|工具升级≠能力提升:自进化大模型智能体的真实进化效能解析

2026年06月02日星期二Harness Updating Is Not Harness Benefit: Disentangling Evolution Capabilities in Self-Evolving LLM Agents👍 9本研究深入剖析大语言模型(LLM)智能体在工具(如提示词、技能)自我进化过程中呈现的两类能力:工具更新与工具获益。核心结论如下:1)工具更新能力与模型底层能力无显著关联,不同规模模型生成的更新带来的性能提升相近;2)工具获益能力呈现非单调特征,中等能力水平的模型获益

2026-06-03 06:31:06  |  2 阅读