AI Agent三大核心概念,买菜就能明白
很多人一上来就想搭Agent,结果折腾半天,连Agent到底是什么都没搞清楚。 今天用去菜市场买菜这个例子,把AI Agent最核心的三个底层概念讲透。 看完你就能判断:一个Agent到底靠不靠谱。
— 正文开始 —
很多人把ChatGPT当成Agent,其实差远了。
普通AI(大模型)= 一个很会聊天的朋友 你问它"今天吃什么",它能给你建议。但它只能动嘴,不能动手。
AI Agent = 一个能帮你干活的管家 你说"帮我做个晚餐",它会自己去查冰箱有什么菜、看菜谱、下单买缺的菜、最后把饭做好。
金句①:大模型是"嘴强王者",Agent才是"干活的人"。 能动手的AI才叫Agent,只能动嘴的叫聊天机器人。
你去菜市场买菜,需要: - 拿钱包付钱 - 用手机看菜谱 - 拿环保袋装菜
这些"工具"你从小就会用,所以不觉得有什么。
但对AI来说,能用工具是一个巨大的飞跃。
工具调用(Tool Use / Function Calling)就是: AI不仅能生成文字,还能调用外部程序来做事。
比如: - 调用搜索引擎查最新信息 - 调用数据库查公司数据 - 调用API发邮件、创建工单 - 调用代码执行器跑Python脚本
# 一个最简单的工具调用示例 tools = [{ "name": "get_weather", "description": "查天气", "parameters": {"city": "城市名"} }] # AI看到用户问"北京今天天气怎样" # 它不会瞎编,而是调用 get_weather(city="北京") # 拿到真实数据后再回答
关键判断标准:一个好的Agent,手里的"工具"越多越实用。 如果一个Agent只会聊天不会用工具,那就是个花架子。
你第二次去菜市场,老板说: "上次你买了3斤排骨,这次要不要再来点?"
你记得: - 上次买的排骨太肥了,这次要瘦的 - 家里酱油快没了,顺便买一瓶 - 老公不吃香菜,别买
这就是记忆的作用。没有记忆,每次对话都是一张白纸。
Agent的记忆分两种:
短期记忆 = 当前对话的上下文 就像你跟老板讨价还价时记得"刚才他说最低15块"
长期记忆 = 跨对话的持久化信息 就像你记得"这个老板总是短斤少两,要用公平秤"
# 短期记忆:对话历史 messages = [ {"role": "user", "content": "我要做一个番茄炒蛋"}, {"role": "assistant", "content": "好的,需要3个番茄..."}, {"role": "user", "content": "改成2个就行"} ] # 长期记忆:向量数据库存储 # 用户偏好 → "不喜欢太甜的菜" → 存入向量库 # 下次做饭时检索出来,自动调整菜谱
金句②:没有记忆的Agent,就像每天失忆的管家—— 今天你告诉他不吃香菜,明天他又给你放了香菜。 记忆能力决定了Agent是"一次性工具"还是"长期搭档"。
你说:"今晚请朋友吃饭,做四菜一汤,预算200块。"
一个没规划能力的人: 看到什么买什么,最后要么超预算,要么菜凑不齐。
一个有规划能力的人: 先想菜单 → 再列清单 → 算预算 → 去菜场按清单买 → 回来按顺序做菜。
这就是规划能力的差距。
规划(Planning)是Agent最核心的能力: 把一个大任务拆成小步骤,按顺序执行,遇到问题还能调整。
常见实现方式:
① ReAct 模式(思考→行动→观察→再思考) 就像做菜时尝一口、调一下味道、再尝。
② 任务分解(大任务拆小任务) "做四菜一汤" → "先做番茄炒蛋" → "再做清蒸鱼" → ...
# 任务分解示例 goal = "帮我写一份周报" # Agent自动拆解为: steps = [ "1. 查看本周日历,列出完成的事项", "2. 查看本周的代码提交记录", "3. 整理遇到的问题和解决方案", "4. 按模板格式生成周报", "5. 发送给主管审批" ] # 然后按顺序执行每一步
关键判断:看一个Agent有没有规划能力,就看它能不能: ① 把大任务拆成小步骤 ② 遇到错误能调整方案 ③ 执行过程中能自我检查
金句③:工具是Agent的手,记忆是Agent的笔记本,规划才是Agent的脑子。 三样缺一样,Agent就是个半成品。
现在把三个概念串起来,看看一个"买菜Agent"怎么运作:
用户需求:"今晚请朋友吃饭,做四菜一汤" 【规划】Agent思考: → 菜单:番茄炒蛋、清蒸鱼、蒜蓉西兰花、红烧排骨、紫菜蛋花汤 → 需要哪些食材?家里有什么?缺什么? → 预算多少?去哪个菜市场? 【记忆】Agent回忆: → 上次朋友说不吃辣,这次不放辣椒 → 家里冰箱还有鸡蛋和西兰花 → 菜市场东边那家鱼新鲜 【工具调用】Agent执行: → 调用"查冰箱"工具 → 发现有鸡蛋、西兰花 → 调用"算价格"工具 → 排骨35+鱼40+番茄10+调料15=100,在预算内 → 调用"下单"工具 → 去菜市场按清单购买 → 调用"做菜"工具 → 按菜谱依次制作
记住这3个判断标准:
✅ 有工具 —— 能不能调用外部程序帮你做事? 只会聊天的Agent = 只会动嘴的厨师
✅ 有记忆 —— 能不能记住你的偏好和历史? 没有记忆的Agent = 每天失忆的管家
✅ 有规划 —— 能不能把大任务拆成小步骤? 没有规划的Agent = 做菜不看菜谱的新手
金句④:下次再有人跟你吹"我们这个AI Agent很强", 你就问三个问题: ① 它能调用什么工具? ② 它有记忆能力吗? ③ 它能把复杂任务拆成步骤吗? 答不上来的,就是个套壳聊天机器人。
❌ 坑1:把"能聊天"当"能干活" 很多Agent只是套了个GPT的壳,连API都不会调。 解法:看它能不能实际执行操作(查数据、发消息、写文件)
❌ 坑2:忽略记忆能力 没有记忆的Agent,每次对话都是从零开始。 解法:看它能不能记住你的偏好、历史对话、之前的决策
❌ 坑3:高估规划能力 有的Agent号称能规划,但拆出来的步骤一塌糊涂。 解法:给它一个稍微复杂点的任务(如"帮我安排明天的会议"),看它拆解得是否合理
避坑口诀: 工具不全的别用——干活得有趁手的家伙 没有记忆的慎用——每次重来的体验太差 规划不行的少用——复杂任务它搞不定
搞懂了这三个概念,你就有了判断Agent好坏的"火眼金睛"。
下一期我会手把手带你搭一个真正能干活的Agent: - 用MCP协议给它接上真实工具 - 用向量数据库给它加上记忆 - 用ReAct模式让它学会规划
从"嘴强王者"变成"干活达人",就差这一步。
👇 关注我,下期教你搭一个真正能干活的AI Agent 点赞+在看,让更多人看到这篇干货