NVIDIA发布物理AI智能体开发栈，开发周期大幅缩短

发布时间：2026-06-03 14:26阅读：21

摘要：本文解析NVIDIA在GTC台北及Computex大会上的最新物理AI开发工具，揭示其如何将物理AI技术栈全面智能化，使AI智能体能够自主完成数据生成、仿真、训练及部署的全链路流程，将机器人开发周期从数周缩减至数小时。此外，项目还开源了人形机器人参考设计，有效降低了物理AI的开发门槛，推动机器人、自动驾驶及工业数字孪生的广泛普及。

引言：物理AI开发的效率瓶颈

尽管物理AI发展迅速，但机器人、自动驾驶和工业数字孪生的开发却面临日益复杂的门槛。传统模式下，开发者需自主构建从数据生成到训练部署的全链路，耗费大量时间在基础设施搭建及组件适配上，致使新应用落地往往耗时数月。虽然软件领域已普及AI智能体自动化，但物理AI领域仍停留在手动操作阶段，效率难以提升。NVIDIA在GTC台北与Computex上发布了全新的开源物理AI技能工具，将整个技术栈改造为智能体可调用模式，从而彻底变革了开发范式。

1. 核心突破：构建智能体可用的物理AI栈

NVIDIA此次的核心突破在于将整个物理AI技术栈优化为智能体可用形式，将原有的库、模型和框架转化为智能体可直接调用的工具，使其能自动驱动全流程开发。

这些工具覆盖物理AI的全领域，包括：

+-NVIDIACosmos3：面向物理世界推理与生成的世界基础模型，能理解视频和文本，预测接下来会发生什么，生成对应的动作。

+-NVIDIAOmniverse：仿真与数字孪生的相关库，用来做工业的虚拟仿真。

+-NVIDIAIsaac：机器人仿真与机器人学习的平台，支撑机器人的全流程开发。

+-NVIDIAMetropolis：视觉AI的相关工具，用来做视觉相关的应用。

+-NVIDIAAlpamayo：自动驾驶的开发平台，支撑自动驾驶的研发。

+-NVIDIAJetson：边缘AI的开发平台，用来做端侧的部署。

NVIDIA的创始人兼CEO黄仁勋表示：“AI智能体正在重塑软件工程，这一变革同样渗透至物理AI，触及交通、制造、医疗及机器人系统。当智能体能直接调用NVIDIA的库与框架时，开发速度将飞跃，助力开发者以前所未有的效率打造未来系统。”

2. 技术细节：通过新技能实现流程自动化

为了让这些工具能被智能体使用，NVIDIA推出了全新技能，将开发流程转化为可重复指令，使编码智能体能自动执行工具调用、结果输出及验证等任务。

同时，他们还推出了：

+-NVIDIANemoClaw：蓝图工具，让开发者能安全地构建和部署自主智能体。

+-NVIDIAOpenShell：运行时，提供基于策略的安全和隐私治理，不管是本地还是云端的硬件，都能支持。

这些技能，能覆盖物理AI的所有领域，包括：

+-机器人与边缘AI：机器人开发者可以用这些技能，加速整个机器人的开发管线，从生成感知和mobility的训练数据，到仿真，自动化导航训练，推进机器人学习，还有Jetson端侧系统的调优部署。

+-自动驾驶：自动驾驶开发者，能用这些技能，把车队采集的数据，重建为仿真环境，大规模生成photorealistic的驾驶场景，还能运行闭环的强化学习，扩展训练和评估的覆盖范围。

+-实时视觉AI智能体：自动化检测和视频智能的开发者，能用这些技能生成合成训练数据，微调模型，自动化标注，还能构建视频AI智能体，用来搜索、总结和分析实时或者录制的视频。

+-工业AI：工业软件开发者，能把工程数据，转化为CAD资产，用来做数字孪生的仿真，优化大型的OpenUSD场景，不用手动的配置。

+-医疗：医疗团队，能引导智能体，创建医院环境的数字孪生，做sim-to-real的数据生成，还有软件在环的策略测试，在部署到临床环境之前，完成所有的验证。

这些技能还可以组合，集成到更大的智能体系统里，让开发者能编排和自动化复杂的工作流，比如数据生成、仿真、优化、推理调优、持续评估这些，全部都能自动化完成。

3. 效果验证：企业应用成效显著

这些新的工具，已经有大量的企业在使用了，而且带来了非常显著的效率提升：

机器人领域的落地

1XTechnologies、AgileRobots、Agility、FieldAI、HexagonRobotics、NEURARobotics、SkildAI、UniversalRobots这些机器人公司，都已经在用NVIDIA的智能体就绪的物理AI栈了。

比如，用了IsaacGR00T的更新之后，端到端的工作流，几个小时就能搭建完成，而之前要花几周的时间，而且它支持全模态的输入输出，视频、传感器、文本、声音都能支持。

还有Foxconn和Compal，在用IsaacforHealthcare来加速医院机器人的开发，Compal正在推进PolyMedX机器人的开发，打造医院级的编排平台，集成仿真、AI和真实的运营；Foxconn则在把Nurabot扩展到多个医院和长期护理的环境里，还推出了新的scrubnurse协作机器人，用来优化手术室的工作流。

制造领域的效率提升

在电子制造领域，TSMC和Pegatron都在用这些工具来微调视觉检测模型：

+-Pegatron用DefectImageGeneration技能生成的合成数据，把模型的训练和部署时间，降低了67%。

+-DeltaElectronics用同样的技能，生成了合成的缺陷数据，把金属汇流排的多余焊料的检测率，提升了17%。

+-Inventec集成了这个技能，打造了自己的观测智能体检测管线，把笔记本chassis制造的缺陷数据收集工作，减少了30%。

+-Foxconn用这个技能，把制造的良率，提升了大约3%，更早地发现错误，提升了效率。

还有SKhynix，正在用Omniverse打造半导体fab的数字孪生，还在验证NVIDIAAgentToolkit，用来做制造专属的物理AI。

自动驾驶领域的落地

自动驾驶的开发者，比如LiAuto、Afari、[DeepRoute.ai](DeepRoute.ai)，都在用OmniverseNuRec模型，做神经场景重建和渲染，他们已经生成了超过1000个重建，每天能做超过30万个渲染和仿真。

还有Foxconn、VinFast、Uber、HUMAIN，都加入了NVIDIADRIVEHyperion生态，用来开发和部署SAELevel4的robotaxi。

4. 人形机器人的新突破：开源设计降低门槛

除工具外，NVIDIA发布了基于Unitree H2底盘及Jetson Thor平台的NVIDIAIsaacGR00TReferenceHumanoidRobot开源参考设计，旨在降低开发门槛，让更多开发者参与进来。

该参考设计采用模块化架构，开发者可灵活集成至现有管线，无需重复搭建基础设施。核心配置包括：

+-UnitreeH2人形底盘：1.8米高，68公斤重，31个自由度，支持人类级别的测试。

+-双SharpaWave触觉五指手：22个自由度，让整个机器人的自由度达到了75个，支持精细的操作。

+-多视角感知：头部的立体相机，140度水平、102度垂直的视野，还有手腕的相机，用来做近距离的操作，还有IMU用来做运动跟踪。

+-全身控制：手臂扭矩最高120牛米，腿部扭矩最高360牛米，额定手臂payload7公斤，峰值15公斤，支持更强的举升和伸展能力。

+-JetsonAGXThorT5000端侧计算：BlackwellGPU，2070FP4teraflops的AI性能，14核ArmCPU，128GB的统一内存，支持实时的传感器处理和机器人推理。

+-完整的连接和电池：支持以太网、Wi-Fi6、蓝牙5.2，还有3小时的续航。

目前，Ai2、ETHZurich、斯坦福机器人中心、UCSanDiego的先进机器人与控制实验室，这些顶尖的研究机构，都计划用这个参考设计，来推进人形机器人的研究，并将于2026年底由Unitree正式发布。

5. 行业意义：智能体化开启物理AI开发新范式

NVIDIA的工具彻底颠覆了开发模式：过去，开发者需手动构建从数据到部署的全流程，耗时漫长且门槛高。如今，智能体化栈将工作转化为自动化流程，开发者仅需聚焦核心应用，大幅缩短开发周期至数小时，降低门槛使小团队也能开发。开源人形机器人参考设计更降低了硬件投入成本，加速行业创新与落地。

6. 未来展望：物理AI规模化落地新契机

物理AI智能体工具现已发布，开发者可通过GitHub及skills.sh使用，且Microsoft、CoreWeave等云服务商正集成该工具以支持规模化部署。未来，物理AI行业将步入智能体化开发常态，开发者能以前所未有的速度产出应用，加速技术普及，让机器人、自动驾驶及工业AI更早融入生活。

结语

NVIDIA此次发布的物理AI工具是行业新里程碑：首次将技术栈全面智能化，实现全流程自动开发，将周期压缩至数小时，并大幅降低开发门槛。这不仅解决了效率瓶颈，更为行业开启了创新窗口。未来，更多开发者将利用这些工具快速产出应用，加速物理AI规模化落地，推动机器人、自动驾驶及工业AI技术更快融入生活。

← 上一篇：e签宝闪耀《赢在AI+》新加坡站 | AI信任科技领航全球数字签约新时代下一篇：TED 深度解析：AI 非独立智能，实为人类镜像 →