标签

黄仁勋预告物理AI爆发:NVIDIA发布Cosmos 3世界模型

发布时间:2026-06-03 04:06来源:新浪新闻阅读:5

新浪科技讯 6月2日下午获悉,NVIDIA正式推出NVIDIA Cosmos™ 3,这是一款专为物理AI设计的开放世界基础模型。该模型基于创新的混合Transformer架构,成功将视觉推理、世界生成及动作预测融合于单一系统,攻克了物理AI的关键挑战:让机器人(15.200, 0.28, 1.88%)、智能驾驶汽车或视觉智能体即便在训练数据匮乏且仿真环境分散的条件下,也能在真实世界中实现高效泛化。

据透露,Cosmos 3具备行业领先的物理精度,能原生解析并生成文本、图像、视频、环境音效及动作指令,将物理AI的训练与评估周期从数月大幅压缩至数天。其独特的混合Transformer架构融合了推理Transformer与专家生成Transformer,确保Cosmos 3在产出视频和动作轨迹前,已深入解析对象间的交互、运动规律及时空关联。

在多项物理AI基准测试中,Cosmos 3系列模型表现卓越。无论是在Artificial Analysis、Physics-IQ、PAI-Bench和R-Bench的世界生成精准度上,还是在RoboLab和RoboArena的动作策略领域,亦或是VANTAGE-Bench和TAR榜单的视觉理解能力方面,Cosmos 3均拔得头筹。

该模型基于全球最大的多模态物理AI数据集之一进行训练,涵盖数十亿条包含文本、图像、视频、音频及动作轨迹的样本。这为开发者提供了坚实的预训练基石,使其能够以更少的数据量和更低的成本构建物理AI系统。

NVIDIA创始人兼CEO黄仁勋指出:“凭借多模态推理语言、视觉技术及世界模型领域的多项突破,物理AI的爆发期已指日可待。Cosmos 3系列作为开放的前沿全模态模型,助力开发者在机器人、智能汽车及视觉AI领域实现跨越式发展,使其能够在物理世界中完成感知、推理、规划与行动。”(文猛)

责任编辑:孙同怀

新浪财经声明:此消息系转载自合作媒体,新浪财经登载此文出于传递更多信息之目的,文章内容仅供参考,不构成投资建议。

郑重声明:1.根据《证券法》规定,禁止编造、传播虚假信息或者误导性信息,扰乱证券市场;2.用户在本社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。