AI与视觉技术论文速览:2026年7月3日
人工智能(cs.AI:Artificial Intelligence)
【1】持久状态AI系统中的分布式攻击
【2】大型语言模型的在线安全监控
【3】ReContext:递归证据重放助力长上下文推理
【4】无人监督时LLM代理的行为:多代理辩论中的社会结构与潜在目标涌现
【5】G-RRM:利用循环推理模型引导符号求解器
【6】EvoPolicyGym:交互环境中自主策略演化的评估
【7】基于大型语言模型的Linux/bash考试自动评分:四层认知分类法
【8】非曼哈顿环境中的文本驱动3D室内场景合成
【9】通过RFM-AGOP实现快速多维拒绝子空间
【10】基于约束的可引导性:编码代理可扩展监督的基础
计算机视觉和模式识别(cs.CV:Computer Vision and Pattern Recognition)
【1】WorldDirector:构建具有持久动态内存的可控世界模拟器
【2】X到4D生成:对齐是关键
【3】PointDiT:用于单目几何估计的像素空间扩散
【4】从SRA到自流:数据增强还是自监督?
【5】寻求分割:全景指代分割的主动感知
【6】无需训练的概念定位应对排版攻击的鲁棒性
【7】GeoMix:基于全局上下文与多检测器训练的无描述符视觉定位
【8】对抗文本噪声与冗余:熵感知的密集视觉令牌剪枝
【9】EAGLE-360:具身主动全局到局部探索
【10】面向解释的云移除:基于观测锚定残差流与地理上下文对齐
机器学习(cs.LG:Machine Learning)
【1】程序即权重:模糊函数的编程范式
【2】DemoPSD:基于分歧调制的策略自蒸馏
【3】超越Adam:SOAP与Muon加速机器学习原子间势能的标签高效训练
【4】神经元感知的数据选择用于无标注LLM自蒸馏
【5】QFedAgent:量子增强的个性化联邦学习用于多代理活动识别
【6】神经元感知的主动少样本学习用于大型语言模型
【7】自门控注意力实现高效时间序列预测
【8】通过分布级奖励优化视觉生成模型
【9】离线强化学习的泛化:结构比悲观程度更重要
【10】HERMES:预训练数据混合的多粒度标注基础
图像和视频处理(eess.IV:Image and Video Processing)
【1】自审计残差漂移用于病理保持的加速膝关节MRI
【2】基于深度学习的DIXON MRI阴茎组织群体分割用于男性生殖健康定量表型
【3】量子启发视觉:利用波粒二象性增强低光照图像