AI技术周报:世界模型自适应、超导体AI发现、仿真新范式
近期AI技术领域迎来多项重大进展:LeCun团队实现世界模型在部署中的持续学习,阿里达摩院AI智能体在28小时内发现6.8万种超导体,英伟达与李飞飞团队提出“Real2Sim”新范式——仅需一段真实视频即可自动生成机器人仿真环境。学术方面,人大高瓴提出强化学习微调新算法,上海交大实现VLA数据筛选加速313倍;产品方面,智谱ZCode编程工具正式上线,Google SynthID水印认证已覆盖超千亿图片。以下按类别进行梳理。
机构:纽约大学/AMI研究所(杨立昆联合创办) | 标签:【具身智能】【世界模型】【持续学习】
纽约大学联合LeCun创办的AMI研究所发布AdaJEPA(自适应潜在世界模型),使JEPA系列世界模型在部署过程中基于真实交互持续更新参数、实时校准预测。传统世界模型训练完成后参数冻结,面对环境变化(如物体位置偏移、光照变化)表现大幅下降。AdaJEPA通过测试时自适应(test-time adaptation)在MPC闭环中持续优化,在PushObj等任务中规划成功率近乎翻倍,每次重新规划仅增加0.01-0.03秒延迟。
核心突破:首次实现世界模型的部署中自适应,无需重新训练即可应对环境变化。
论文:AdaJEPA: An Adaptive Latent World Model 链接:https://arxiv.org/abs/2606.32026[1]
机构:阿里达摩院/中国人民大学/中国科学院大学 | 标签:【AI for Science】【智能体】【材料科学】
阿里达摩院联合中国人民大学高瓴人工智能学院、中国科学院大学发布首个专攻超导材料发现的AI智能体ElementsClaw(元素虾)。该框架融合大型原子模型(LAM)与大型语言模型(LLM),仅用28个GPU小时即从240万种稳定晶体结构中预测出6.8万种可能的超导材料,命中率达40%。经实验合成验证,4种全新超导体被成功制备,临界温度最高达6.5K。
达摩院科学智能负责人荣钰表示,这是AI智能体发现并获验证的第一批超导材料,初步验证了AI智能体框架在材料发现领域的大规模潜力。
论文:Agentic Fusion of Large Atomic and Language Models 链接:https://arxiv.org/abs/2604.23758[2] 报道:https://www.ithome.com/0/972/089.htm[3]
机构:地瓜机器人(D-Robotics) | 标签:【具身智能】【世界模型】【仿真】
地瓜机器人正式发布Uranus世界模型,但给出了差异化定位——不做机器人“大脑”,而是作为机器人开发基础设施,提供两项核心能力:benchmark评测和sim-to-real仿真。Uranus具备帧级闭环和跨具身零样本泛化能力,训练时仅见过2秒片段,推理时却能稳定运行60秒。
值得注意的是,团队称项目三分之二的精力投入在基础设施搭建和数据清洗等“脏活”,映射出当前具身智能行业的核心痛点——真正稀缺的不是算法,而是工程化能力。
报道:https://www.aitntnews.com/newDetail.html?newId=26819[4]
机构:NVIDIA GEAR Lab / Stanford University | 标签:【具身智能】【Sim2Real】【仿真生成】
英伟达GEAR Lab联合李飞飞团队等发布SimFoundry系统,只需一段真实场景视频就能自动生成可交互的机器人仿真环境。系统通过提取、生成、增强三阶段流水线,在保持物体功能不变的前提下扩展出大量新物体、新场景和新任务,为机器人策略学习提供近乎无限的训练数据,且实现零样本部署到真实机器人。
传统Sim2Real成本高昂,SimFoundry开创性地转向Real2Sim路线——先真实采集、再自动转为仿真,低成本高产出,为具身智能大规模训练开辟了新路径。
论文:SimFoundry: Modular and Automated Scene Generation 链接:https://arxiv.org/abs/2606.28276[5] 项目:https://research.nvidia.com/labs/gear/simfoundry/[6]
机构:中国人民大学高瓴人工智能学院 | 标签:【强化学习】【大模型】【微调】
中国人民大学高瓴团队提出DelTA算法,通过求解优化问题为每个token计算最优权重,使强化学习微调更加稳定。传统RL微调对所有token一视同仁,导致关键token权重被稀释、训练震荡。DelTA通过数学优化动态分配token级权重,在数学推理、代码生成等任务上全面超越现有SOTA,提升幅度最高达3.26个点。
该方法计算开销小、即插即用,有望成为RL微调的标准组件。
机构:上海交通大学 | 标签:【具身智能】【VLA模型】【数据筛选】
上海交通大学等团队提出ATHENA数据筛选框架,首次将影响函数(influence function)扩展到十亿参数级别的VLA(Vision-Language-Action)模型,量化每条机器人示教数据对任务成功率的影响。计算耗时从8054.6 GPU小时降至25.7 GPU小时(加速313倍),仅用66.7%的精选训练数据即在真实机器人任务上达到68%成功率,超过全量训练的60%。
这意味着机器人训练不必“多多益善”,数据质量比数量更重要——ATHENA做到了精准识别哪些数据真正有用。
机构:智谱AI | 标签:【编程工具】【Agent】【应用产品】
智谱AI正式发布编程工具ZCode,作为GLM 5.2官方开发环境。上线9天内迭代7个版本,迭代速度惊人的背后是ZCode的基础架构完善度。新增功能包括:Goals长程任务规划、移动端Remote远程操控、飞书Bot远程控制、子智能体协作、会话分支Fork等。BYOK(自带密钥)支持用户配置自有API Key,订阅用户享1.5倍配额。
ZCode的快速迭代和长程任务能力,标志着国产AI编程工具从“代码补全”向“项目管理型AI”跃迁。
报道:https://www.aitntnews.com/newDetail.html?newId=26824[7]
机构:Google DeepMind | 标签:【AI安全】【内容认证】【行业标准】
Google旗下的AI水印技术SynthID已达到里程碑式规模:已为超过1000亿张图片/视频和6万小时音频内容添加不可见水印,验证功能被使用超过5000万次。Chrome浏览器新增右键一键检测AI图片功能。更关键的是,OpenAI、NVIDIA、Apple等竞争对手也开始采用该技术标准,SynthID正从“独门技术”演变为行业事实标准。
在AI生成内容泛滥的时代,可验证的内容溯源基础设施比以往任何时候都重要。
报道:https://www.aitntnews.com/newDetail.html?newId=26829[8]
本周AI技术前沿呈现三大趋势:世界模型走向自适应与工程化(AdaJEPA持续学习、Uranus定位裁判、SimFoundry Real2Sim)、AI for Science加速落地(ElementsClaw发现超导体)、基础设施层竞争加剧(ZCode编程工具、SynthID行业标准、ATHENA数据筛选)。
[1] https://arxiv.org/abs/2606.32026
[2] https://arxiv.org/abs/2604.23758
[3] https://www.ithome.com/0/972/089.htm
[4] https://www.aitntnews.com/newDetail.html?newId=26819
[5] https://arxiv.org/abs/2606.28276
[6] https://research.nvidia.com/labs/gear/simfoundry/
[7] https://www.aitntnews.com/newDetail.html?newId=26824
[8] https://www.aitntnews.com/newDetail.html?newId=26829
[9] https://arxiv.org/abs/2606.32026
[10] https://arxiv.org/abs/2604.23758
[11] https://www.ithome.com/0/972/089.htm
[12] https://www.aitntnews.com/newDetail.html?newId=26819
[13] https://arxiv.org/abs/2606.28276
[14] https://research.nvidia.com/labs/gear/simfoundry/
[15] https://www.aitntnews.com/newDetail.html?newId=26824
[16] https://www.aitntnews.com/newDetail.html?newId=26829
[17] https://www.aitntnews.com/ainews/zh-CN
[18] https://blog.csdn.net/techforward/article/details/162557338