标签

AI从虚拟走向现实:机器人时代全面开启

发布时间:2026-06-03 15:03来源:微信阅读:3

点击上方蓝色文字关注我们

每天为你解读最前沿的科技动态,今天的话题颇具前瞻性。

近期科技新闻透露出一个明显趋势:人工智能正从“屏幕中的对话助手”演变为“具备实体形态的智能存在”。

6月1日,OpenAI正式宣布重返机器人领域,成立OpenAI Robotics团队,全面进军实体机器人。同一天,在台北GTC 2026大会上,英伟达发布Agent Toolkit、Nemotron 3 Ultra模型,并宣布Vera Rubin平台进入全面量产阶段。国产GPU厂商摩尔线程也在6月1日正式开源AI智能体框架MTClaw。

三大线索共同指向一个方向:AI不再局限于文档撰写、图像绘制、信息检索等虚拟任务,而是正逐步迈入物理世界。

这一轮具身智能的发展已进入全面爆发的前夜。

核心看点:6年前因数据不足而解散机器人团队,如今奥特曼亲自挂帅重建,并将世界模拟能力作为核心武器。

6月1日,奥特曼在社交平台正式宣布组建“OpenAI Robotics”团队,并公开招募全栈硬件、运营、系统及机器学习工程师。团队的领军人物是DALL-E和Sora的核心发明者阿迪亚·拉梅什——他过去一年带领的“世界模拟”研究项目,如今变成了这支机器人团队。

实际上,OpenAI涉足机器人的历史比特斯拉、Figure这些公司更早。2018年,OpenAI曾推出Dactyl机器人项目,通过强化学习实现机械手解魔方,一度成为全球机器人灵巧操作领域的标杆。但2020年,由于数据获取困难、机器人迭代缓慢,团队被迫解散。此后OpenAI转向投资模式,先后投资了1X、Figure AI等机器人初创公司。

转折点在2025年2月——Figure AI创始人宣布终止与OpenAI的合作,转而自主研发端到端模型。双方的公开分歧直接点明了OpenAI今天亲自下场的原因:通用大模型需要和硬件深度耦合,外部合作解决不了根本问题。

和特斯拉“先造身体后装大脑”的路线不同,OpenAI走了一条完全相反的路:先让AI在虚拟世界中理解物理规律,再把这套能力迁移到实体机器人。

这正是Aditya Ramesh过去多年的核心方向——他在DALL-E和Sora上的工作本质上都是教会AI“这个世界长什么样、怎么运转”。机器人上,从而解决真机数据采集成本高、泛化困难的行业痛点。

短期目标是研发辅助型机器人,聚焦建筑、基础设施建设场景,协助电工、管道工等技术工人作业,定位于“助力而非替代”。

长期愿景是打造普惠型通用个人机器人,覆盖家庭服务和日常照料场景。

OpenAI用一句话概括了这个未来:“致力于共同编程和制造对社会真正有用的机器人。”

值得注意的是,OpenAI选择这个时间点亲自下场做机器人,背后的IPO压力不得不提。据多家媒体报道,OpenAI已于2026年5月22日秘密提交了IPO招股书草案,计划最早于2026年9月上市。在今年3月完成的最新一轮融资中,OpenAI估值已达8520亿美元。在即将启动IPO的背景下,将机器人业务从“投资标的”升级为“内部核心战略”,有助于向资本市场讲述从虚拟走向实体的新增长故事。

但OpenAI也面临巨大的亏损压力。公司预计2026年全年亏损约140亿美元,毛利率仅约33%,高昂的AI模型推理成本是利润的主要吞噬者。。

答案是:不确定,但这是目前最具想象力的方向。

虚拟世界的训练再完美,也无法完全复现真实物理环境的复杂性和不确定性。OpenAI的DALL-E和Sora已经证明,AI可以在虚拟环境中生成高度逼真的图像和视频,但将这些能力迁移到真实世界中实现物理交互,还需要跨越工程、感知、控制等多个维度的挑战。这也是OpenAI Robotics未来需要解决的核心难题。

如果说OpenAI是在造“机器人背后的智能大脑”,那英伟达做的是更底层的功夫——为全球开发者提供构建和运行各类AI智能体的基础设施和开发平台。英伟达创始人兼CEO黄仁勋在GTC台北大会上表示:“AI智能体正在革新软件开发,而这场变革如今延伸至物理AI,进一步渗透到将重塑交通运输、制造业、医疗照护与机器人领域的系统之中。”

英伟达在GTC 2026大会上正式推出Agent Toolkit,这是一套涵盖软件、开源模型和蓝图的综合套件,旨在帮助开发者构建能执行复杂业务流程的长期运行AI智能体。目前,Agent Toolkit已支持AI智能体直伟达的核心能力库:Cosmos世界基础模型用于推理与生成物理世界内容,Omniverse用于构建工业数字孪生,Isaac聚焦机器人仿真与学习。五大应用垂直领域——机器人、自动驾驶、工业AI、视觉AI、医疗照护——均可直接受益。。

Nemotron 3 Ultra是一个拥有5500亿参数的混合专家模型,专为可执行编码、科研和企业工作流而无需人工干预的长期运行自主智能体设计。据英伟达称,该模型推理速度比同类前沿模型快至多5倍,运行成本降低至多30%。该模型已在2026年6月4日正式上线。

黄仁勋对此的表述值得玩味:“希望透过开放策略协助企业打造专属代理生态系,加速AI普及速度。”言外之意,英伟达不打算把模型封闭起来自己用,而是想让全球开发者基于这个基础设施创建各种AI智能体——无论是虚拟的数字员工,还是物理世界的机器人。

如果说Nemotron 3 Ultra是智能体的“大脑”,那么Vera Rubin就是支撑这些大脑运作的“超级工厂”。英伟达宣布Vera Rubin平台已进入全面量产阶段,供应链规模是上一代Grace Blackwell平台的两倍以上。Vera Rubin专为代理式AI设计,在规模化代理吞吐量上相比前代提升10倍,是英伟达目前最强大的代理式AI超级平台。

黄仁勋在演讲中这样解释Vera Rubin的战略意义:“代理式AI是一种全新的工作负载。一个提示词可以启动上千步的推理、检索、工具使用和响应生成之旅。Vera Rubin就是为了这一时刻而生的——一个按规模化交付智能的AI工厂引擎,具备推动下一次工业革命所需的性能、效率与安全性。”

在GTC 2026大会上,黄仁勋还重磅发布了全球首款专为AI智能体打造的Windows PC——“RTX Spark超级芯片”。它史无前例地搭载了6144个GPU核心、128GB统一内存,将过去只有数据中心才有的算力,塞进了一台笔记本。。

黄仁勋说:“40年后,英伟达要和微软一起重新发明PC。”Windows 3.1时代PC还是企业的工具,直到Windows 95才把PC变成人手一台的消费电子。而今天,那个让一切发生的“DirectX加应用”组合,将被“大模型加AI智能体”彻底取代。大模型是新时代的DirectX,AI智能体是新时代的应用。

微软和英伟达一口气端出桌面、笔记本、工作站三件套,全部100% Windows兼容、100% CUDA、100% Tensor Core。最值得一提的是桌面机——它能让AI智能体7天24小时跑着,不计费。没有额度焦虑,下载一个本地模型,这个智能体就彻底是你自己的。。

Cadence、西门子、Synopsys和达索系统正利用Nvidia的NemoClaw构建自主AI工程师,将数周的工程仿真工作量压缩至数小时内完成。Cadence的ChipStack AI超级智能体已被Nvidia自身用于自主验证芯片设计;西门子则将NemoClaw和OpenShell整合到其Fuse EDA AI智能体中,用于半导体和印刷电路板设计中的多工具工作流。

富士康正在为其Nurabot和CoDoctor医疗平台试行NemoClaw,并正在构建一个工厂运营智能体。CrowdStrike正使用Nemotron模型构建可持续识别和修复漏洞的安全智能体。。

在这场AI走向物理世界的浪潮中,国产厂商也没有缺席。以GPU国产替代为使命的摩尔线程在2026年6月1日正式开源AI智能体框架MTClaw,面向桌面控制场景的AI智能体加速方案,打出了漂亮的差异化道路——聚焦最贴近日常办公和开发者的“桌面控制”场景。。

当前主流AI智能体在桌面控制场景中面临着致命痛点——慢。每次简单的截图、点击或文件操作,都要完整发往远端大模型进行推理决策,好比让首席科学家去处理“打开抽屉拿支笔”的琐事。

MTClaw的差异化方案令人眼前一亮:不改变大模型本身,而是在其前端增加一层“前台助理”角色,通过“前台助理+轻量模型”协作,高频轻量动作毫秒级响应,复杂场景自动流转给大模型,无侵入式部署让用户无需修改底层业务代码即可接入。。

实测数据相当亮眼:任务执行速度提升约7倍、成功率可达100%。。

摩尔线程围绕具身智能正在构筑全栈能力:

全域智能体“小麦”:搭载自研MTClaw开源框架,集成90余项CLI系统工具,打破传统助手的被动局限;;

具身智能仿真平台MT Lambda:国内首个全栈国产化具身智能仿真平台,通过机器狗实景演示具身策略开发与动作训练;;

算力底座:通过全功能GPU算力底座与国家级中试基地资源,推动具身智能自主创新与规模化落地,助力国产实体智能技术从仿真走向现实。。

摩尔线程走了一条和英伟达不同的路:英伟达提供的是从芯片到模型再到安全运行环境的完整工具链,赋能全球开发者;而摩尔线程目前更聚焦于利用自身国产GPU生态,为国内开发者提供一个兼容、高效、可落地的高性价比Agent桌面执行方案。

但随着摩尔线程持续完善其中等算力GPU与AI智能体生态,我们有理由期待中国的“国产CUDA生态”在未来成长为一个具有完整自主可控能力的AI基础设施体系。

三家企业虽然路径不同,但目标惊人一致:让AI智能体从屏幕里的聊天框走向物理世界。如果说2023-2024年AI战场的主旋律是“ChatBot对话竞赛”,那么2026年的主旋律一定是“AI智能体在真实世界中的落地竞赛”。

如果说英伟达是智能体时代的操作系统,OpenAI是通用人工智能的实力冲锋者,那么摩尔线程正以国产自主可控的力量,为中国AI智能体生态的建设提供另一条充满潜力的路径。

一个AI智能体无处不在的全新时代,正在加速向我们走来。

“如果给你一个AI智能体机器人,你最想让它帮你做什么?”

是帮你完成复杂的工作任务,做一个超级高效的AI助理?

是帮你打理家庭琐事,让你每天多出2小时做真正想做的事?

还是有其他更有趣的想法?

欢迎在评论区聊聊~