AI 热门论文精选（2026-04-15）

发布时间：2026-04-15 14:23阅读：35

本报告由Euler通过全网检索汇总，聚焦于大语言模型、多模态技术、视觉语言交互、强化学习以及AI智能体这五大核心领域。

作者: Peiyang Song et al. |发表: TMLR 2026 链接: https://arxiv.org/abs/2602.06176 摘要: 本文深入剖析了大语言模型在推理过程中出现的失效问题，创新性地构建了分类体系：依据推理性质将其区分为具身与非具身两类，后者再细分为非形式（直觉）与形式（逻辑）推理；依据失效模式则分为三类：架构层面的固有缺陷、应用场景的特殊局限以及对细微变动的敏感问题。针对上述各类问题，文章探究了其根源并提出了相应的解决对策，旨在为打造更加稳健的 LLM 推理体系提供理论支撑。

作者: Daniel Paleka et al. |发表: arXiv cs.CR 链接: https://arxiv.org/abs/2602.16800 摘要: 研究发现大语言模型存在被利用进行大规模去匿名化的风险。实验数据显示，拥有全网访问权限的 LLM Agent 仅凭匿名的网络资料与对话记录，便能精准识别 Hacker News 用户及 Anthropic Interviewer 参与者。研究团队构建了从伪匿名库提取特征、利用语义嵌入检索匹配项、最后进行逻辑验证的三阶段攻击路径。在各类跨平台数据集测试中，LLM 方法的召回率达到 68%（精度 90%），远超传统方法接近 0% 的水平。该研究提醒我们，必须重新审视网络隐私面临的威胁。

作者: Kai Jiang et al. |发表: ICML 2026 链接: https://arxiv.org/abs/2511.18507 摘要: 本文重点探讨多模态大语言模型（MLLM）在终端设备上运行时遭遇的知识遗忘难题。研究团队建立了包含高空、水下、低空及室内环境的 MSVQA 多模态数据集，并提出了 UNIFIER 持续学习框架。该框架借助视觉表征扩展（VRE）和视觉一致性约束（VCC），实现了同场景知识的积累与跨场景知识的增强。测试结果显示，在 20 步跨场景持续学习任务中，UNIFIER 相比最优方法 QUAD，其 VQA 得分提升了 2.70%~10.62%，F1 得分提升了 3.40%~7.69%。

作者: Mohammad Asadi et al. |发表: arXiv cs.AI 链接: https://arxiv.org/abs/2603.21687 摘要: 研究揭露了多模态 AI 系统在视觉理解方面存在的严重隐患。实验显示，先进模型出现了“海市蜃楼推理”怪象：即便未提供图像，模型也能生成详尽的描述与推理，甚至在无图状态下于胸部 X 光问答测试中名列前茅。更令人担忧的是，当要求模型主动猜测而非默认图像存在时，其性能急剧下降。论文指出现有基准测试存在文字泄露问题，提出了 B-Clean 方法以确保评估的公平性与视觉根基，这对医疗等高风险领域至关重要。

作者: Anonymous |发表: ICC 2026 链接: https://arxiv.org/abs/2601.12744 摘要: 文章提出了 IntentOpt 基准，旨在首次全面评估视觉语言模型（VLM）从网络拓扑图自动生成优化代码的能力。评估涵盖了 17 类共 85 道优化题目，结果发现：相较于纯文本输入，视觉参数提取导致执行成功率降低了 12~21 个百分点，GPT-5-Mini 从 93% 掉至 72%；思维程序提示甚至使性能下降了 13 个百分点；开源模型（如 Llama-3.2-11B-Vision 仅 18%）明显落后于闭源模型。该研究证实了 VLM 在意图驱动网络（IBN）中的实际应用潜力。

作者: Ruichuan An et al. |发表: ICLR 2026 链接: https://arxiv.org/abs/2603.01083 摘要: 本文深入研究了视觉语言模型（VLM）在平面设计美学评价上的表现，推出了 AesEval-Bench 基准。该基准包含 4 个维度、12 项指标及 3 种量化任务（美学判定、区域筛选、精准定位）。研究对各类 VLM 进行了全面测试，揭示了现有模型在精细美学评估上的不足，并构建了含人工引导标注的数据集以供模型微调，为设计美学评估领域建立了首个系统性的评测框架。

作者: I-Hung Hsu et al. |发表: ICLR 2026 链接: https://arxiv.org/abs/2510.25992 摘要: 针对小模型在多步推理中面临的 RLVR（可验证奖励强化学习）采样率低、SFT（监督微调）易过拟合长序列数据的问题，文章提出了 SRL（监督强化学习）框架。SRL 将解题过程重构为生成逻辑“动作”序列，要求模型在提交动作前先输出内部推理独白，并根据专家动作相似度给予平滑奖励。实验证明，SRL 帮助小模型攻克了此前 SFT 和 RLVR 均无法解决的高难度问题；结合 SRL 初始化与后续 RLVR 精调，可获得最佳性能，并能有效迁移至 Agent 软件工程任务。

作者: Xuefeng Wang et al. |发表: ICLR 2026 链接: https://arxiv.org/abs/2602.17078 摘要: 当前连续时间多智能体强化学习（CT-MARL）方法多基于 HJ-Bellman 方程，难以处理安全约束（如碰撞惩罚）造成的不连续性。论文提出了连续时间约束 MDP（CT-CMDP）框架，通过几何形式（epigraph）重构将离散 MDP 转化为连续时间约束问题，并采用基于物理信息神经网络的 Actor-Critic 方法（PINN）进行求解。在安全多粒子环境和 MuJoCo 基准测试中，该方法实现了更平滑的值函数逼近、更稳定的训练过程及更优越的性能。

作者: Anonymous |发表: Working Paper, April 2026 链接: https://arxiv.org/abs/2604.04604 摘要: 本文首次对 AI Agent 在欧盟法律体系中的合规性进行了全面梳理，涉及《欧盟 AI 法》《通用数据保护条例》《网络弹性法》等多项法规。研究提出了九类 Agent 部署分类法，识别了网络安全、人工监督、多方行动链透明度及运行时行为漂移等特定合规难题，设计了十二步合规架构，并指出当前高风险 Agent 系统尚无法满足《欧盟 AI 法》的基本要求。

作者: Dayong Ye et al. |发表: arXiv cs.MA 链接: https://arxiv.org/abs/2604.00430 摘要: 随着LLM Agent融入实际应用，其知识陈旧或敏感的问题愈发严重。本文首次深入探讨了 LLM Agent 的“遗忘”机制，将遗忘场景划分为三类：状态遗忘（遗忘特定状态或条目）、轨迹遗忘（遗忘动作序列）以及环境遗忘（遗忘整个环境或任务类别），并设计了将高层遗忘指令转化为可执行提示的自然语言方法。实验证明，该方法能帮助 Agent 有效忘却特定知识而不影响其他任务表现，并能有效防止对手通过查询推断出遗忘内容。

本报告由 Euler 基于全网检索汇总 · 2026-04-15

← 上一篇：AI驱动，AR眼镜能否复刻智能手表增长神话？下一篇：AI+幼教：从减负开始，在真实场景扎根 →