标签

AI 热门论文精选(2026-04-15)

发布时间:2026-04-15 14:23来源:微信阅读:15

本报告由Euler通过全网检索汇总,聚焦于大语言模型、多模态技术、视觉语言交互、强化学习以及AI智能体这五大核心领域。

作者: Peiyang Song et al. |发表: TMLR 2026 链接: https://arxiv.org/abs/2602.06176 摘要: 本文深入剖析了大语言模型在推理过程中出现的失效问题,创新性地构建了分类体系:依据推理性质将其区分为具身与非具身两类,后者再细分为非形式(直觉)与形式(逻辑)推理;依据失效模式则分为三类:架构层面的固有缺陷、应用场景的特殊局限以及对细微变动的敏感问题。针对上述各类问题,文章探究了其根源并提出了相应的解决对策,旨在为打造更加稳健的 LLM 推理体系提供理论支撑。

作者: Daniel Paleka et al. |发表: arXiv cs.CR 链接: https://arxiv.org/abs/2602.16800 摘要: 研究发现大语言模型存在被利用进行大规模去匿名化的风险。实验数据显示,拥有全网访问权限的 LLM Agent 仅凭匿名的网络资料与对话记录,便能精准识别 Hacker News 用户及 Anthropic Interviewer 参与者。研究团队构建了从伪匿名库提取特征、利用语义嵌入检索匹配项、最后进行逻辑验证的三阶段攻击路径。在各类跨平台数据集测试中,LLM 方法的召回率达到 68%(精度 90%),远超传统方法接近 0% 的水平。该研究提醒我们,必须重新审视网络隐私面临的威胁。

作者: Kai Jiang et al. |发表: ICML 2026 链接: https://arxiv.org/abs/2511.18507 摘要: 本文重点探讨多模态大语言模型(MLLM)在终端设备上运行时遭遇的知识遗忘难题。研究团队建立了包含高空、水下、低空及室内环境的 MSVQA 多模态数据集,并提出了 UNIFIER 持续学习框架。该框架借助视觉表征扩展(VRE)和视觉一致性约束(VCC),实现了同场景知识的积累与跨场景知识的增强。测试结果显示,在 20 步跨场景持续学习任务中,UNIFIER 相比最优方法 QUAD,其 VQA 得分提升了 2.70%~10.62%,F1 得分提升了 3.40%~7.69%。

作者: Mohammad Asadi et al. |发表: arXiv cs.AI 链接: https://arxiv.org/abs/2603.21687 摘要: 研究揭露了多模态 AI 系统在视觉理解方面存在的严重隐患。实验显示,先进模型出现了“海市蜃楼推理”怪象:即便未提供图像,模型也能生成详尽的描述与推理,甚至在无图状态下于胸部 X 光问答测试中名列前茅。更令人担忧的是,当要求模型主动猜测而非默认图像存在时,其性能急剧下降。论文指出现有基准测试存在文字泄露问题,提出了 B-Clean 方法以确保评估的公平性与视觉根基,这对医疗等高风险领域至关重要。

作者: Anonymous |发表: ICC 2026 链接: https://arxiv.org/abs/2601.12744 摘要: 文章提出了 IntentOpt 基准,旨在首次全面评估视觉语言模型(VLM)从网络拓扑图自动生成优化代码的能力。评估涵盖了 17 类共 85 道优化题目,结果发现:相较于纯文本输入,视觉参数提取导致执行成功率降低了 12~21 个百分点,GPT-5-Mini 从 93% 掉至 72%;思维程序提示甚至使性能下降了 13 个百分点;开源模型(如 Llama-3.2-11B-Vision 仅 18%)明显落后于闭源模型。该研究证实了 VLM 在意图驱动网络(IBN)中的实际应用潜力。

作者: Ruichuan An et al. |发表: ICLR 2026 链接: https://arxiv.org/abs/2603.01083 摘要: 本文深入研究了视觉语言模型(VLM)在平面设计美学评价上的表现,推出了 AesEval-Bench 基准。该基准包含 4 个维度、12 项指标及 3 种量化任务(美学判定、区域筛选、精准定位)。研究对各类 VLM 进行了全面测试,揭示了现有模型在精细美学评估上的不足,并构建了含人工引导标注的数据集以供模型微调,为设计美学评估领域建立了首个系统性的评测框架。

作者: I-Hung Hsu et al. |发表: ICLR 2026 链接: https://arxiv.org/abs/2510.25992 摘要: 针对小模型在多步推理中面临的 RLVR(可验证奖励强化学习)采样率低、SFT(监督微调)易过拟合长序列数据的问题,文章提出了 SRL(监督强化学习)框架。SRL 将解题过程重构为生成逻辑“动作”序列,要求模型在提交动作前先输出内部推理独白,并根据专家动作相似度给予平滑奖励。实验证明,SRL 帮助小模型攻克了此前 SFT 和 RLVR 均无法解决的高难度问题;结合 SRL 初始化与后续 RLVR 精调,可获得最佳性能,并能有效迁移至 Agent 软件工程任务。

作者: Xuefeng Wang et al. |发表: ICLR 2026 链接: https://arxiv.org/abs/2602.17078 摘要: 当前连续时间多智能体强化学习(CT-MARL)方法多基于 HJ-Bellman 方程,难以处理安全约束(如碰撞惩罚)造成的不连续性。论文提出了连续时间约束 MDP(CT-CMDP)框架,通过几何形式(epigraph)重构将离散 MDP 转化为连续时间约束问题,并采用基于物理信息神经网络的 Actor-Critic 方法(PINN)进行求解。在安全多粒子环境和 MuJoCo 基准测试中,该方法实现了更平滑的值函数逼近、更稳定的训练过程及更优越的性能。

作者: Anonymous |发表: Working Paper, April 2026 链接: https://arxiv.org/abs/2604.04604 摘要: 本文首次对 AI Agent 在欧盟法律体系中的合规性进行了全面梳理,涉及《欧盟 AI 法》《通用数据保护条例》《网络弹性法》等多项法规。研究提出了九类 Agent 部署分类法,识别了网络安全、人工监督、多方行动链透明度及运行时行为漂移等特定合规难题,设计了十二步合规架构,并指出当前高风险 Agent 系统尚无法满足《欧盟 AI 法》的基本要求。

作者: Dayong Ye et al. |发表: arXiv cs.MA 链接: https://arxiv.org/abs/2604.00430 摘要: 随着LLM Agent融入实际应用,其知识陈旧或敏感的问题愈发严重。本文首次深入探讨了 LLM Agent 的“遗忘”机制,将遗忘场景划分为三类:状态遗忘(遗忘特定状态或条目)、轨迹遗忘(遗忘动作序列)以及环境遗忘(遗忘整个环境或任务类别),并设计了将高层遗忘指令转化为可执行提示的自然语言方法。实验证明,该方法能帮助 Agent 有效忘却特定知识而不影响其他任务表现,并能有效防止对手通过查询推断出遗忘内容。

本报告由 Euler 基于全网检索汇总 · 2026-04-15