AI智能体:从动嘴到动手的跨越
你手里的AI还在光说不练,别人家的AI早已付诸行动。深夜八点,你拖着疲惫的身体回家,打开手机里那个号称无所不能的AI助手,询问红烧肉的做法。它的回答简直完美——挑选三层肥瘦相间的五花肉,冷水下锅焯水,小火慢火熬制糖色,讲得头头是道。可结果呢?锅还得你自己开,油烟还得你自己吸,忙活一个小时,最后要么默默放下手机煮碗泡面。
这就是过去几年你与人工智能相处的真实状态:它博学多才,却懒于动手。光动嘴皮子时,它是天才;真要动手操作,它就像不存在一样。
不过,现在的局势已经逆转。想象一下,有一位大厨,自己检查冰箱里的食材,自主制定菜单,亲自掌勺烹饪,味道淡了就自己加盐,食材不足了还会下楼采购,最终把一桌热气腾腾的佳肴端到你面前——这位能独立执行任务、真正把事情办妥的大厨,就是当下科技圈最炙手可热的概念:AI智能体,即 AI Agent。
其中的核心差距在于“知道”与“做成”之间的鸿沟。无论聊天机器人多么智能,其产出永远只有一种形式:一段文字。食谱是文字,建议是文字,哪怕把代码粘贴进对话框,本质上依然是文字。将文字转化为实际成果的人,始终是你自己。
其实英文中的“Agent”一词原本并不高深,其本义就是代理人——为你办事的人。无论是保险代理人、房产中介还是明星经纪人,英文统称为 Agent。这个词的核心在于:你下达一个目标,它替你达成,中间繁琐的过程无需你操心。因此,AI智能体简单来说就是:一个能替你完成任务的AI代理人。
若将大厨烹饪的全过程拆解开来,你便能彻底看透智能体的内部构造。
感知、规划、行动、观察,再回到感知——这四个步骤构成一个闭环,不断循环,直到任务完成。这个循环过程,就是智能体的心跳,业内称之为智能体循环。
记住这一点就足够了:聊天机器人是问答模式,答完即止;而智能体则是目标驱动、循环运作,任务未完成,它就不会停止工作。
顺便将围绕智能体的关键概念理清:
只要搞懂这几个概念,再看任何关于智能体的文章,你就不会感到困惑。
上世纪九十年代,全球最经典的人工智能教材中就为智能体下过定义:凡是能够感知环境并做出反应的物体,都属于智能体。按照这个定义,你家墙上的恒温器就是一个最原始的智能体:感知到温度变化,便自动启动制冷或制热。扫地机器人亦是如此:遇到障碍物,自动转向。
问题究竟出在哪里?在于“大脑”。恒温器和扫地机器人虽然具备了感知和行动能力,但大脑单一,只能按照预设的规则反应。而前几年出现的大语言模型则恰恰相反:大脑极其聪明,却只有一张嘴,完全没有手脚。一边是有手没脑,一边是有脑没手——这两种状态各自存在已久。
真正的转折点出现在最近几年。有研究人员提出让大模型一边推理一边行动——想一步,做一步,观察结果,再进行下一步。2023年春天,开源项目 AutoGPT 发布后迅速走红,短短几周内便成为当时全球增长最快的开源项目之一。尽管第一代智能体还很笨拙,但全世界都在那一刻意识到:AI长出双手,只是时间问题。
在聊天机器人时代,你与AI的关系是“请教”:你需要学会提问,它负责回答,具体的活还得你干。而在智能体时代,你们的关系转变为“派活”:你明确目标、提供工具、设定权限,随后验收结果。你的角色,从亲自操作的工人,转变为了指挥专家干活的老板。
当然,将任务交出去是有风险的。大厨能做出好菜,但也可能因疏忽把厨房烧了。智能体也是如此:权限要逐步授予,关键操作要事先询问,重要结果必须亲自验收。优秀的管理者从不当甩手掌柜——用人要信任,验收不能少。
AI时代,无需事事亲力亲为。你只需掌握最基础的部分,剩下的绝大部分,放心交给它去执行。学会如何指挥专家,远比自己成为专家重要一万倍。
—————
📺 更多知识视频,搜索「Wiki4What」