标签

AI Agent 元年:从对话到具身,AI 将拥有实体

发布时间:2026-05-28 10:32来源:微信阅读:4

置身澳门BEYOND Expo,我在具身智能展区驻足良久,凝视了足足十分钟。

银河通用G1正在现场实操咖啡冲泡与货架整理。云深处的四足机器人“绝影M20”模拟巡检任务,在复杂地貌中如履平地。沃飞长空的eVTOL飞行器悬停于展台之上。腾讯Robotics X的人形机器人,正与现场观众进行实时互动对话。

2026年5月19日,在谷歌I/O开发者年度盛会上,谷歌发布了一系列关于Agentic AI(代理式人工智能)的更新,并明确指出“AI Agent将在2026年重塑工作模式”。

将这两件事联系起来,我猛然顿悟:我们正身处一个从“对话”迈向“行动”进而走向“具身”的历史转折点。AI不再仅仅是你的参谋——它正蜕变为执行者,并开始孕育属于自己的“双眼”与“肢体”。

AI能力的进化,并非循序渐进的改良,而是一次三级跳。

第一级:动口。ChatGPT时代。你提问,它回答。AI宛如一部全知全能的百科全书。这是“对话智能”——你明知AI在思考,但它始终隐匿于屏幕之后。

第二级:动手。Agent时代。你指令AI“帮我筛选并排序这100份简历”,它自动拆解任务、读取文档、对照标准、输出结果,你只需静候通知。这是“执行智能”——AI不再是解答问题的工具,而是替你操劳的得力下属。

第三级:感知物理世界。具身智能时代。AI不再局限于屏幕内工作,它操控机器人、无人机、传感器及工厂流水线。能“看见”真实世界,能“触碰”真实物体,能“移动”于真实空间。

唯有第三级,才是真正让多数职业产生危机感的阶段。

“动口”取代的是信息处理,“动手”取代的是流程执行,而“具身”取代的则是所有需要动手操作、眼观六路、依据真实环境实时决策的工作。

或许你未曾听闻此词,但该角色正于硅谷迅速崛起。

传统AI工程师负责编写代码、搭建架构、调优模型。而vibe engineer则截然不同——他们不写代码,他们调控“氛围”。

其核心能力在于:描述感受,而非阐述逻辑。

“帮我设计一个让用户感到被尊重,却不过分热情的界面。”——这句话,AI能理解,vibe engineer能清晰表达。

“这款产品的格调应像一家有品位的日本买手店,而非大型超市。”——这类模糊、审美、感知层面的内容,vibe engineer懂得如何转化为AI可执行的指令。

本质上,vibe engineer是AI时代的“翻译官”。他们将人类的感受、审美与文化直觉,翻译成AI能理解并执行的语言。

这一角色之所以成立,是因为AI的能力边界已从“执行精确指令”拓展至“理解模糊意图”。你无需再告知AI每一步如何操作,只需清晰传达你想要的“感觉”。

这并非程序员的工作,而是诗人的工作,用技术语言书写。

5月27日,第六届BEYOND国际科技创新博览会在澳门盛大开幕。

主题为“AI:数实共生”——数字经济与实体经济,线上与线下,屏幕之内与屏幕之外。近800家全球科技企业参展,专业观众逾3万名,具身智能成为本届最大亮点。

银河通用G1机器人,现场演示咖啡制作与货架零售——绝非实验室演示,而是真实的商业场景。机器人从货架取货、识别商品、放置收银台,全流程自主完成。

云深处四足机器人绝影M20,能在复杂地形稳定移动——楼梯、碎石、崎岖路面。工业巡检、灾后救援,机器狗能抵达人类不愿涉足之地。

沃飞长空AE200系列eVTOL,电动垂直起降飞行器,城市空中交通的雏形初现。

腾讯Robotics X实验室自研的人形机器人,亦在本届展会亮相。

BEYOND Expo联合创始人贺建东直言:“在亚洲,不仅有顶尖的软件公司构建AI模型,更有强大的硬件工厂,真正赋予AI以物理实体的基础设施。”

据IDC预测,2026年全球智能机器人硬件市场规模将逼近300亿美元,中国具身智能市场规模将突破110亿美元。

Google在2026年报告中提出Agentic AI概念,明确AI Agent将改变工作方式。

据Salesforce联合德勤调研显示,89%的企业团队已在使用AI Agent。

据Gartner预测,至2026年底,40%的企业应用将集成AI Agent(2025年该数据不足5%)。

但另一组数据更值得深思:据德勤企业调研,85%的企业计划定制Agent,但仅有25%的试点项目真正上线至生产环节。构想与落地之间,横亘着一道现实之墙。

第一堵墙:数据孤岛

多数企业的业务流程按“人工执行”设计,AI Agent介入后,系统间未打通,数据无法流动。神州数码调研发现,AI Agent落地普遍陷入“点状场景创新,难规模化复制”的困境——HR用Agent筛简历,财务用Agent对账,但两系统间互不相通。

第二堵墙:ROI难量化

德勤指出,AI Agent的商业化验证面临“自主性悖论”——企业追求AI的自主性,但AI越自主,风险越难管控。ROI难以量化,导致大量试点项目停滞于“概念验证”阶段。

第三堵墙:流程重构

购置服务器易,改造流程难。AI Agent介入后,权限需重新分配,风险需重新评估,考核需重新设计。技术可采购,流程改造却不可购买。

两类人。

第一类:擅长运用vibe engineer思维工作的人

他们不依赖代码,而依靠描述感受。他们是AI与真实需求之间的翻译层。AI越强,此类人的价值越大——因为AI需要更精准的“感觉翻译”。

第二类:能将AI Agent落地至物理世界的人

具身智能赛道缺少的并非技术,而是能将技术与场景衔接的人。理解机器人能力边界、洞察工业场景需求、掌握甲方采购逻辑——这种跨界能力,目前极度稀缺。

这两类人有一个共同特质:他们并非AI的替代者,而是AI的放大器。

AI会“动口”,会“动手”,如今更要长出“身体”。而这两类人,正是决定AI“身体”向何处生长的头脑。

BEYOND Expo的主题是“数实共生”。此词用得极为精准。

AI并非要取代实体经济,而是要成为实体经济的一部分。具身智能并非要让机器人“替代人”,而是让AI去承担那些人类不应从事的任务——高重复、高风险、高精度。

但真正的门槛,从来不是技术。技术将日益廉价,日益开放。

真正的门槛在于:谁率先厘清了AI与自身赛道的结合点,谁便率先攫取了效率红利。

AI Agent元年,并非“AI将改变世界”的元年。而是“你能否用AI改变自己赛道”的元年。