清华五道口AI俱乐部 | 物理AI模型突破、百万级上下文窗口发布、世界模型路线曝光、机器人研发加速

发布时间：2026-06-02 08:05阅读：13

各位早安！欢迎收听清华五道口AI俱乐部，每日为您梳理人工智能领域的最新动态。

NVIDIA推出开源全模态物理智能模型Cosmos 3

2026年6月1日，NVIDIA正式发布全球首个完全开源的全模态物理智能大模型Cosmos 3。该模型采用突破性的混合Transformer结构，业界首次实现对文本、图像、视频、环境音效及物理动作的统一理解与生成能力，基于海量多模态物理世界数据完成训练。在实际应用层面，Cosmos 3能够将物理智能的训练周期从数月压缩至数天，大幅加快具身智能与机器人技术的研发进展。在Artificial Analysis等权威开源评测基准中，该模型多个关键指标位居首位。同时，NVIDIA同步启动"宇宙联盟"生态计划，携手全球多家机构共同推进物理智能的标准化建设与技术演进，进一步强化其在具身智能基础模型领域的领导地位。

MiniMax推出M3模型支持百万token上下文与多模态融合

2026年6月1日，MiniMax正式发布新一代旗舰模型MiniMax M3。该模型基于自主研发的MiniMax Sparse Attention稀疏注意力机制，API原生支持最高100万tokens的超长上下文窗口，可一次性处理海量信息。作为原生多模态模型，M3重新构建了底层数据管线，实现文本与视觉语义的深度融合，在需要跨模态理解的复杂任务中表现卓越。在智能体权威基准BrowseComp评测中，M3以83.5的高分超越Claude Opus 4.7，展现出强大的自主执行能力。此外，M3可独立复现ICLR 2025杰出论文的全部实验流程，在连续12小时的自主运行中产生了18次代码提交与23张图表，初步验证了长周期科研自动化的可行性。MiniMax同步推出M3与M3-highspeed两个版本API，分别注重极致性能与高性价比，以适配不同应用场景需求。

NVIDIA开源5500亿参数Nemotron 3 Ultra模型

2026年6月1日，NVIDIA发布5500亿参数混合专家模型Nemotron 3 Ultra，专为7×24小时不间断运行的智能体打造。该模型相比同级别前沿开源模型推理速度最高提升5倍，使用成本降低30%，已适配Hermes Agent等主流智能体平台。CrowdStrike、Palantir等企业已采用其构建长效智能体执行漏洞排查及业务优化任务。模型将于6月4日通过Hugging Face以NVIDIA NIM微服务形式发布。

DeepSeek推出DeliAutoResearch SKILL进化版本

DeepSeek研究员陈德里发布关于持续学习与自我迭代的新论文，其自主科研智能体框架DeliAutoResearch SKILL实现迭代进化。框架模拟同行评审分数从6分提升至8分，新增自主设计并运行实验能力，通过减少交互轮数、增加token消耗提升自主性。论文提出覆盖大语言模型持续学习的三轴分类框架，分析五大方法类别及收敛条件，指出规模与灾难性遗忘等六大开放挑战。

MIT研发注意力匹配技术实现上下文内存50倍压缩

近日，麻省理工学院研究团队提出注意力匹配技术，可将大型语言模型上下文内存压缩高达50倍且精度无损。该技术通过数学优化匹配注意力输出，引入每token标量偏差β实现权重重分配，结合重复预填充与自我学习机制。在QuALITY基准测试中50倍压缩下准确率接近Cartridges方法，LongHealth医疗卷宗测试中表现优于传统摘要方案，已在Qwen3-4B等模型验证。

OpenAI正式组建机器人部门并启动人才招聘

2026年6月1日，OpenAI CEO萨姆·奥尔特曼宣布成立OpenAI Robotics部门，由阿迪亚·拉梅什领导，重点招聘全栈硬件、运营、系统及机器学习工程师。短期聚焦开发协助技术工人建设基础设施的机器人，长期目标是让每人拥有个性化需求的个人机器人。技术路线采用硬件与机器学习协同设计，将Sora等技术积累的物理世界理解能力迁移至真实机器人控制。

NVIDIA联合微软、Arm发布N1X AI芯片

2026年6月1日，NVIDIA、微软与Arm联合发布基于ARM架构的N1X AI芯片，采用ARM v9.2架构及6144个CUDA核心，AI算力达1000 TOPS。该芯片标志着PC行业从x86向ARM架构的重大转变，端侧AI算力达200 TOPS。同时，NVIDIA联合微软推出RTX Spark计算平台，基于N1X实现本地智能体调用Rhino、Blender等工具完成3D设计全流程。

Intel发布18A制程至强6+处理器

2026年6月1日，Intel推出至强6+处理器，作为Intel 18A制程首款数据中心CPU，最高288核，支持12通道DDR5内存与96通道PCIe Gen 5/CXL。每线程每瓦性能领先竞品45%，专为云原生、智能体AI及网络密集型负载优化。同步发布以太网E835控制器，支持200 GbE吞吐量，能效比同类产品高1.4至1.9倍，以及面向中小企业的至强6300 12核版处理器。

VAST完成近2亿美元融资并公布世界模型技术路线

2026年6月1日，通用人工智能公司VAST完成近2亿美元A+及A++轮融资，正式公布世界模型路线Project Eden。系统分为结构化状态层、条件接口层和生成式渲染层三层架构，底层状态层维护跨时间全局世界状态。数据策略采用互联网视频自标注与Agent引擎自动探索，实现环境持久化、场景复用模块化及原生多玩家交互，支持多人在线时算力成本线性可控。

哈佛教授尹希加入OpenAI

近日，哈佛大学史上最年轻华人正教授、弦论专家尹希被曝加入OpenAI。尹希曾公开表示AI可将科研效率提升100倍，其同事已通过Claude在人类监督下完成论文全流程。作为Simons Bootstrap合作项目首席研究员，尹希的加入将助力OpenAI在理论物理等高复杂度领域探索AI推理边界，推动科研范式从传统实验室向算力驱动模式迁移。

以上就是今日AI快讯的全部内容，感谢大家的收听。

← 上一篇：AI 信任即生产力，新税制重塑华人养老与房产价值下一篇：超越图灵测试：构建新的人工智能评估体系 →