AI Agent入门第十二课:上下文工程——你的输入方式,决定了AI的聪明程度
# AI Agent入门第十二课:上下文工程——你的输入方式,决定了AI的聪明程度
「我以为只要把Prompt写好就万事大吉了,直到Agent在第15轮对话后完全迷失了方向……」
那次我在测试一个旅行规划Agent时,前面沟通还挺顺畅,后来它突然开始答非所问。当我说"帮我看看有没有更优惠的选择"时,它却开始跟我聊起背包收纳技巧。我盯着屏幕愣了三秒,心里嘀咕:我的Prompt写得明明挺不错的啊?
后来才明白,Prompt写好只是第一步,真正让Agent保持"清醒"的,是一门叫Context Engineering(上下文工程)的手艺。今天第12课,咱们就来聊聊这个。
打个比方。
Prompt Engineering是什么?就像员工入职第一天,给他准备了一份详尽的工作手册:职责是什么、如何汇报、需要注意什么。写好了,交出去,搞定。
Context Engineering是什么?是在整个工作过程中,你持续给这个员工补充信息——"客户刚提出新需求"、"之前那份报告已经失效了"、"这个工具现在可以用了"——同时还要把他桌上堆积的旧文件清理掉,避免他被淹没。
简而言之:PE是静态的,一次性的;CE是动态的,全程管理信息流的。
你写出一个好Prompt,Agent开始工作得很顺畅。但任务运行起来后,信息不断涌入、积累、过时、冲突——这时候光靠那份说明书已经不够了。上下文工程,就是在管理这整个过程。
Agent的"大脑"里,实际上装着好几种不同性质的信息。我整理成一张表,一目了然:
这五类信息,每一类都有自己的生命周期和风险点。上下文工程要管的,就是这五类信息在Agent运行全程里的进进出出。
理论说完,来点实操。上下文工程有个三步走的规划思路:
拿"帮我订机票"这个场景走一遍:
这三步做完,Agent知道自己该看什么、不该看什么,才不会跑着跑着迷路。
知道了要管什么,再来看怎么管。
另外三个策略简单提一下:Memories(记忆存储)是跨会话的持久化,让Agent记住"你上次说过不喜欢红眼航班";Sandbox Environments(沙箱)是让Agent在隔离环境里跑代码,只把关键结果读回来,不污染主上下文;Runtime State Objects(运行时状态容器)是给复杂任务维护一个结构化的状态对象,比如"当前步骤=第3步,已确认信息=出发地+日期,待确认=座位偏好"。
好,以上都是讲"怎么做好"。现在来说最有意思的部分:哪些情况会把上下文搞坏。我继续用旅行订票的场景来举例,这样更直观。
它没有忘记你的问题,它只是被上下文里的旅行故事带走了。
这四种失效模式,说白了,都是信息管理的问题,不是模型本身变笨了。喂错信息、喂杂信息、喂冲突信息,再聪明的模型也会乱。
最后补充一个常见的概念混淆:RAG和Context Engineering是什么关系?
RAG(检索增强生成)你可能听说过——就是AI回答问题之前,先去检索相关文档,把检索结果塞进上下文里,再生成回答。这是解决"模型不知道最新信息"问题的主流方案。
但RAG只是Context Engineering的一个工具,专门负责处理五类上下文里的Knowledge(知识)这一类。它解决的是"从哪里取知识、怎么取"的问题。
Context Engineering是更宏观的框架,管理的是所有五类上下文的全生命周期——不只是知识,还有指令、工具、对话历史、用户偏好。RAG做得再好,其他四类上下文搞砸了,Agent照样出问题。
简单说:RAG是一块零件,CE是整台发动机。
AI的世界每天都比昨天更陌生一点,但也更有意思一点。我们明天见。
📌 第13课预告:Agent的记忆系统——从「每次从零开始」到「记得你说过的每一件事」,期待的扣1。