AI Agent三层架构详解:智能体总不靠谱,究竟缺了什么
从Prompt提示到Harness约束,带你看清自主智能体的结构与核心。 经过大模型“能聊会写”的惊艳阶段后,行业关注点正快速转向 AI Agent(智能体)。 人们已经不再满足于一个只能聊天写文的对话窗口,而是希望拥有一个能够自动解读报表、操控软件、安排出行的数字员工。 然而理想很美,现实却常常很难:不是Agent转头就忘了刚说过的话,就是它信心十足地执行了危险命令,最终引发生产事故。 根源在哪里?关键就在架构。一个真正可靠的企业级Agent,绝不是靠一句写得漂亮的提示词就能支撑起来的。它背后遵循的是一套完整而严谨的三层架构体系:Prompt层、Context层、Harness层。
今天这篇文章,就来深入拆开这三层如何彼此配合,把“聊天玩具”真正打磨成“生产工具”。
定位:意图映射与角色限制的分界线 很多人把Prompt理解成“提问”,这其实是很大的偏差。在Agent架构里,Prompt层本质上是一组高度结构化的元指令。 它决定了Agent要以什么身份、遵守什么规则、按照什么格式来思考。 这一层主要承担三项任务: 1. 明确角色与边界 这是防止模型“胡编乱造”的第一层屏障。 例如: “你是高级数据分析师,只能依据给定的SQL结果作答,禁止主观延伸。” 2. 约束输出格式 如果希望Agent接入自动化系统,模型输出就不能是一段自由文本,而必须是程序能够解析的JSON。 例如: 输出必须遵循:{ “thought”: “…”, “action”: “tool_name”, “input”: “…” } 这一步一旦没做好,Harness层就无法正确识别和执行指令。 3. 注入思维模板(CoT) 引导模型不要直接给结论,而是像人一样呈现 “思考-行动” 路径(如ReAct范式)。这不仅能提升复杂推理任务的准确率,也能为后续上下文保留有价值的审计痕迹。 💡思考笔记: Prompt Engineering真的过时了吗?其实并没有,它只是升级成了系统工程。真正比拼的,不再是“措辞技巧”,而是对模型注意力分配的精准控制。
定位:状态记忆与动态认知场景 大模型本身是无状态的,处理完一句话后就可能“忘记前文”。Context层的作用,就是为Agent建立一个短期工作记忆区和一个外部知识存储区。 如果Prompt规定了“要做什么”,那么Context记录的就是 “当前进行到哪里” 以及 “周边发生了什么”。 这一层主要管理三类信息流: 1. 会话滑动窗口 保存最近的对话内容。这里有一个很现实的规律:Context越长,模型越容易“发散”(注意力被摊薄),同时调用成本也会更高。 2. 工具执行回执 Agent刚刚是否查询了数据库?有没有报错?返回空值到底是业务正常还是程序异常? 例如: 代码Agent只有看到Context中的报错堆栈,才会主动修复代码。没有这段记忆,它就可能一次次提交同样的错误。 3. 外部知识库(RAG) 将企业内部文档切片后存入向量库,在需要时检索召回。这是让Agent理解专业语境、避免胡乱编造的关键方式。 💡 思考笔记: Context管理的核心矛盾在于 “既想让马跑,又不能喂太多草” 。优秀的架构设计必须加入主动压缩和筛选机制——借助小模型先做摘要,再把最关键的几KB信息提供给大模型。
定位:执行调度与安全沙箱 这是三层架构里最硬的一层,也是判断Agent到底是助手还是风险源的关键分界。 “Harness”本来的含义是马具、线束,这个词非常贴切地描述了这一层的双重作用:一方面像线束那样连接外部世界(工具/API),另一方面又像缰绳一样控制烈马(防止越权执行)。 Harness主要掌握三项关键能力: 1. 工具调用网关 模型输出的可能只是一句自然语言:“帮我查一下明天的天气”。 Harness则负责把它转换成函数签名 get_weather(location=‘北京’, date=‘明天’),处理超时与重试,再把JSON结果转回自然语言交还给模型。 2. 流程状态机(防止偏航) 真正的企业流程不是让AI随意发挥的。 例如: 报销流程必须遵循:提交单据 → 主管审批 → 财务付款。 Harness层通过有向无环图把路径强行固定。如果模型在主管审批阶段突然想去查天气?Harness会立刻拦下:“无此权限,请返回当前任务。” 3. 最终安全护栏 这是Harness最核心的部分。 · 代码沙箱: 模型生成的代码在执行前必须先检查,若发现 sudo 或危险删除指令,立即中断。 · 成本熔断: 防止Agent掉进死循环,持续消耗Token带来高额成本。 💡 思考笔记: 很多人觉得用LangChain做Agent不够可控,原因就在于只使用了Prompt和Context的拼接能力,却忽略了Harness层的硬编码限制。真正能落地的Agent,关键节点一定要交给确定性代码处理,模型只负责非关键的语义理解。
这三层并不是简单堆叠,而是共同形成了一个持续运转的反馈飞轮: 1. Prompt + Context 注入:系统Prompt结合Context提取出的记忆信息 → 输入给模型。 2. 推理与触发:模型读取Context末尾内容,输出 <调用工具> 指令。 3. Harness接管:解析指令 → 调用工具 → 获取结果。 4. 回流闭环:将执行结果作为新的Context节点追加进去 → 再回到第1步。 这也就是经典的 ReAct(Reasoning + Acting)循环。
当我们讨论AI Agent时,关注的早已不只是单一模型算法,而是完整的分布式系统工程。 · Prompt层 负责约束 意图。 · Context层 负责维护 记忆。 · Harness层 负责控制 行为与安全。
如果你只是想做一个“演示Demo”,也许有Prompt和Context就够用了;但如果你要打造一个真正能承接业务的数字劳动力,就必须把最多的研发投入放在Harness层——那里既是Agent的骨架支撑,也是最后一道安全底线。