酷阅新闻

AI与视觉技术论文速览：2026年7月3日

发布时间：2026-07-03 20:59阅读：2

人工智能(cs.AI:Artificial Intelligence)

【1】持久状态AI系统中的分布式攻击

【2】大型语言模型的在线安全监控

【3】ReContext：递归证据重放助力长上下文推理

【4】无人监督时LLM代理的行为：多代理辩论中的社会结构与潜在目标涌现

【5】G-RRM：利用循环推理模型引导符号求解器

【6】EvoPolicyGym：交互环境中自主策略演化的评估

【7】基于大型语言模型的Linux/bash考试自动评分：四层认知分类法

【8】非曼哈顿环境中的文本驱动3D室内场景合成

【9】通过RFM-AGOP实现快速多维拒绝子空间

【10】基于约束的可引导性：编码代理可扩展监督的基础

计算机视觉和模式识别(cs.CV:Computer Vision and Pattern Recognition)

【1】WorldDirector：构建具有持久动态内存的可控世界模拟器

【2】X到4D生成：对齐是关键

【3】PointDiT：用于单目几何估计的像素空间扩散

【4】从SRA到自流：数据增强还是自监督？

【5】寻求分割：全景指代分割的主动感知

【6】无需训练的概念定位应对排版攻击的鲁棒性

【7】GeoMix：基于全局上下文与多检测器训练的无描述符视觉定位

【8】对抗文本噪声与冗余：熵感知的密集视觉令牌剪枝

【9】EAGLE-360：具身主动全局到局部探索

【10】面向解释的云移除：基于观测锚定残差流与地理上下文对齐

机器学习(cs.LG:Machine Learning)

【1】程序即权重：模糊函数的编程范式

【2】DemoPSD：基于分歧调制的策略自蒸馏

【3】超越Adam：SOAP与Muon加速机器学习原子间势能的标签高效训练

【4】神经元感知的数据选择用于无标注LLM自蒸馏

【5】QFedAgent：量子增强的个性化联邦学习用于多代理活动识别

【6】神经元感知的主动少样本学习用于大型语言模型

【7】自门控注意力实现高效时间序列预测

【8】通过分布级奖励优化视觉生成模型

【9】离线强化学习的泛化：结构比悲观程度更重要

【10】HERMES：预训练数据混合的多粒度标注基础

图像和视频处理(eess.IV:Image and Video Processing)

【1】自审计残差漂移用于病理保持的加速膝关节MRI

【2】基于深度学习的DIXON MRI阴茎组织群体分割用于男性生殖健康定量表型

【3】量子启发视觉：利用波粒二象性增强低光照图像

← 上一篇：AI聊天恐成偏执助推器：个性化互动加剧妄想风险下一篇：浙江全力布局人工智能：数据确权、智能交通与算力扩容齐头并进 →