标签

清华五道口AI俱乐部 | 物理AI模型突破、百万级上下文窗口发布、世界模型路线曝光、机器人研发加速

发布时间:2026-06-02 08:05来源:微信阅读:6

各位早安!欢迎收听清华五道口AI俱乐部,每日为您梳理人工智能领域的最新动态。

NVIDIA推出开源全模态物理智能模型Cosmos 3

2026年6月1日,NVIDIA正式发布全球首个完全开源的全模态物理智能大模型Cosmos 3。该模型采用突破性的混合Transformer结构,业界首次实现对文本、图像、视频、环境音效及物理动作的统一理解与生成能力,基于海量多模态物理世界数据完成训练。在实际应用层面,Cosmos 3能够将物理智能的训练周期从数月压缩至数天,大幅加快具身智能与机器人技术的研发进展。在Artificial Analysis等权威开源评测基准中,该模型多个关键指标位居首位。同时,NVIDIA同步启动"宇宙联盟"生态计划,携手全球多家机构共同推进物理智能的标准化建设与技术演进,进一步强化其在具身智能基础模型领域的领导地位。

MiniMax推出M3模型支持百万token上下文与多模态融合

2026年6月1日,MiniMax正式发布新一代旗舰模型MiniMax M3。该模型基于自主研发的MiniMax Sparse Attention稀疏注意力机制,API原生支持最高100万tokens的超长上下文窗口,可一次性处理海量信息。作为原生多模态模型,M3重新构建了底层数据管线,实现文本与视觉语义的深度融合,在需要跨模态理解的复杂任务中表现卓越。在智能体权威基准BrowseComp评测中,M3以83.5的高分超越Claude Opus 4.7,展现出强大的自主执行能力。此外,M3可独立复现ICLR 2025杰出论文的全部实验流程,在连续12小时的自主运行中产生了18次代码提交与23张图表,初步验证了长周期科研自动化的可行性。MiniMax同步推出M3与M3-highspeed两个版本API,分别注重极致性能与高性价比,以适配不同应用场景需求。

NVIDIA开源5500亿参数Nemotron 3 Ultra模型

2026年6月1日,NVIDIA发布5500亿参数混合专家模型Nemotron 3 Ultra,专为7×24小时不间断运行的智能体打造。该模型相比同级别前沿开源模型推理速度最高提升5倍,使用成本降低30%,已适配Hermes Agent等主流智能体平台。CrowdStrike、Palantir等企业已采用其构建长效智能体执行漏洞排查及业务优化任务。模型将于6月4日通过Hugging Face以NVIDIA NIM微服务形式发布。

DeepSeek推出DeliAutoResearch SKILL进化版本

DeepSeek研究员陈德里发布关于持续学习与自我迭代的新论文,其自主科研智能体框架DeliAutoResearch SKILL实现迭代进化。框架模拟同行评审分数从6分提升至8分,新增自主设计并运行实验能力,通过减少交互轮数、增加token消耗提升自主性。论文提出覆盖大语言模型持续学习的三轴分类框架,分析五大方法类别及收敛条件,指出规模与灾难性遗忘等六大开放挑战。

MIT研发注意力匹配技术实现上下文内存50倍压缩

近日,麻省理工学院研究团队提出注意力匹配技术,可将大型语言模型上下文内存压缩高达50倍且精度无损。该技术通过数学优化匹配注意力输出,引入每token标量偏差β实现权重重分配,结合重复预填充与自我学习机制。在QuALITY基准测试中50倍压缩下准确率接近Cartridges方法,LongHealth医疗卷宗测试中表现优于传统摘要方案,已在Qwen3-4B等模型验证。

OpenAI正式组建机器人部门并启动人才招聘

2026年6月1日,OpenAI CEO萨姆·奥尔特曼宣布成立OpenAI Robotics部门,由阿迪亚·拉梅什领导,重点招聘全栈硬件、运营、系统及机器学习工程师。短期聚焦开发协助技术工人建设基础设施的机器人,长期目标是让每人拥有个性化需求的个人机器人。技术路线采用硬件与机器学习协同设计,将Sora等技术积累的物理世界理解能力迁移至真实机器人控制。

NVIDIA联合微软、Arm发布N1X AI芯片

2026年6月1日,NVIDIA、微软与Arm联合发布基于ARM架构的N1X AI芯片,采用ARM v9.2架构及6144个CUDA核心,AI算力达1000 TOPS。该芯片标志着PC行业从x86向ARM架构的重大转变,端侧AI算力达200 TOPS。同时,NVIDIA联合微软推出RTX Spark计算平台,基于N1X实现本地智能体调用Rhino、Blender等工具完成3D设计全流程。

Intel发布18A制程至强6+处理器

2026年6月1日,Intel推出至强6+处理器,作为Intel 18A制程首款数据中心CPU,最高288核,支持12通道DDR5内存与96通道PCIe Gen 5/CXL。每线程每瓦性能领先竞品45%,专为云原生、智能体AI及网络密集型负载优化。同步发布以太网E835控制器,支持200 GbE吞吐量,能效比同类产品高1.4至1.9倍,以及面向中小企业的至强6300 12核版处理器。

VAST完成近2亿美元融资并公布世界模型技术路线

2026年6月1日,通用人工智能公司VAST完成近2亿美元A+及A++轮融资,正式公布世界模型路线Project Eden。系统分为结构化状态层、条件接口层和生成式渲染层三层架构,底层状态层维护跨时间全局世界状态。数据策略采用互联网视频自标注与Agent引擎自动探索,实现环境持久化、场景复用模块化及原生多玩家交互,支持多人在线时算力成本线性可控。

哈佛教授尹希加入OpenAI

近日,哈佛大学史上最年轻华人正教授、弦论专家尹希被曝加入OpenAI。尹希曾公开表示AI可将科研效率提升100倍,其同事已通过Claude在人类监督下完成论文全流程。作为Simons Bootstrap合作项目首席研究员,尹希的加入将助力OpenAI在理论物理等高复杂度领域探索AI推理边界,推动科研范式从传统实验室向算力驱动模式迁移。

以上就是今日AI快讯的全部内容,感谢大家的收听。