AI智能体实战培训全解析
时长:1–2天(理论+实操)
受众:产品经理 / 开发者 / 运营 / 业务负责人
前置要求:了解基础LLM概念
第1页 · 封面
标题:AI智能体(AI Agent)实战培训
副标题:从概念到落地,从Coze到Dify
讲师 / 日期
第2页 · 课程地图
模块概览:概念→架构→实操→Multi-Agent→RAG→避坑→动手
预期收获:理解Agent本质 + 能搭一条完整流水线
第3页 · 从Chatbot到Agent
Chatbot:一问一答,被动响应
Agent:感知→规划→行动→反思,主动完成任务
核心公式:Agent = LLM + Memory + Tools + Planner
第4页 · Agent核心四组件
Perception(感知):接收用户输入 / 环境信号
Planning(规划):拆解任务,制定步骤
Action(行动):调用工具 / API / 写代码
Memory(记忆):短期对话 + 长期知识
第5页 · ReAct框架详解
Thought(思考)→ Action(行动)→ Observation(观察)→ 循环
对比:CoT只是思考,ReAct会真正动手
第6页 · Agent vs Workflow
Workflow:固定流程图,确定性高
Agent:动态决策,灵活性高
实际落地:两者结合最佳
第7页 · 什么任务适合Agent?
适合:多步骤 / 需调用工具 / 需外部知识 / 结果开放
不适合:纯计算 / 高频低价值 / 必须零误差
第8页 · 互动讨论
你工作中哪些场景可以用Agent?
小组分享 + 讲师点评
第9页 · 开源框架一览
LangChain / AutoGen / CrewAI / OpenDevin
各自特点与适用人群
第10页 · LangChain Agent
AgentExecutor + Tool + LLM
优缺点:生态丰富,但抽象层厚
第11页 · CrewAI
Agent + Task + Crew
Process.sequential vs Process.hierarchical
第12页 · 国内平台:Coze(扣子)
Bot模式 vs Workflow模式
优势:上手快、飞书/微信集成、定时触发
局限:私有化受限
第13页 · 国内平台:Dify
App / Workflow / Dataset 三层结构
优势:开源、可私有化、变量映射灵活
局限:UI复杂度高于Coze
第14页 · 平台对比表
第15页 · 如何选型?
对外发布 + 非技术团队 → Coze
内部系统 + 私有化需求 → Dify
深度定制 + 研究性质 → LangChain/CrewAI
第16页 · Function Calling原理
LLM输出结构化JSON → 决定调哪个工具 + 传什么参数
工具定义:name / description / parameters(JSON Schema)
第17页 · 工具调用循环
用户提问 → LLM决定调工具 → 执行工具 → 结果回注LLM → LLM生成最终回答
可多步、可并行
第18页 · 工具定义最佳实践
description写清楚:何时用、不用会怎样
参数名语义化,加example
Temperature设0.2–0.5
第19页 · 常见失败与处理
选错工具:加强description
参数错误:加few-shot示例
超时/报错:Fallback策略(重试 / 默认值 / 转人工)
第20页 · 实操演示
Coze中创建一个天气查询工具
Dify中创建一个HTTP API工具
第21页 · 三种记忆类型
短期记忆:当前对话窗口
长期记忆:向量数据库存储用户偏好/历史
外部存储:数据库/表格记录业务数据
第22页 · 窗口超限怎么办?
滑动窗口裁剪
对话摘要压缩(Summarization)
关键信息持久化
第23页 · 多用户隔离
Session ID区分
每个用户独立向量空间
不可跨用户读取记忆
第24页 · 实操演示
Coze中配置长期记忆
Dify中通过变量实现会话隔离
第25页 · RAG是什么?
Retrieve → Augment → Generate
解决幻觉 + 利用私有知识
第26页 · 基础RAG流程
文档切块 → Embedding → 向量库存储
用户提问 → 向量检索 → 拼接上下文 → LLM回答
第27页 · 进阶RAG优化
查询改写(Query Rewrite)
混合检索(向量 + BM25)
重排序(Rerank)
第28页 · 知识库维护
Chunk大小:500–1000字符
定期更新 + 版本管理
多知识库路由(按部门/品类)
第29页 · 实操演示
Coze中创建知识库并绑定Agent
Dify中Dataset配置 + 召回测试
第30页 · 为什么需要Multi-Agent?
单一Agent难以覆盖长链路
职责分离 → Prompt更短 → 输出更稳
可单独调试、迭代
第31页 · 常见拓扑结构
串行流水线(Pipeline)
中心调度+子Agent(Hub-Spoke)
辩论/对抗(Debate)
第32页 · 串行模式详解
A输出 → B输入 → C输入
适合:前后依赖明确的流程
案例:服装品牌 趋势→企划→内容→供应链→客服
第33页 · 中心调度模式
Orchestrator分配任务 → Worker执行 → 汇总
适合:并行任务 + 结果聚合
第34页 · Agent间通信
JSON结构化传递(推荐)
共享数据库/表格
消息队列(高级)
第35页 · Multi-Agent避坑
变量命名不一致 → 下游拿不到数据
无Fallback → 单点故障整条断
角色边界不清 → 互相越权
第36页 · 实操演示
Coze Workflow串联5个Agent
Dify中Agent节点 + 变量映射
第37页 · Agent System Prompt结构
角色定义:你是谁
任务描述:你要做什么
约束条件:不能做什么
输出格式:JSON / Markdown
工具列表:可用工具有哪些
第38页 · 提高工具选择准确率
Tool Description写清楚使用场景
加few-shot示例
冲突工具增加优先级说明
第39页 · 输出格式控制
"请严格按照以下JSON格式输出,不要包裹markdown代码块"
Temperature ≤ 0.3
必要时用OutputParser
第40页 · 安全红线
写操作必须Human-in-the-loop
敏感信息脱敏
Prompt Injection防护
第41页 · 日志与审计
记录每次Tool Call + 输入输出
异常告警
定期复盘Agent决策
第42页 · 评估指标
任务完成率
平均步数
工具调用准确率
用户满意度
第43页 · 线上监控
延迟 / Token消耗 / 失败率
兜底率(转人工比例)
异常检测 + 告警
第44页 · 落地路线图
第一阶段:单Agent跑通(1–2周)
第二阶段:串成Multi-Agent(2–4周)
第三阶段:灰度上线 + 人工兜底(1–2月)
第四阶段:持续优化 + 扩大场景
第45页 · 常见踩坑总结
低估理解成本
忽视维护成本
幻觉未充分治理
没有人工兜底就全量上线
第46页 · 分组任务说明
每组选一个业务场景(客服/内容生产/数据分析等)
设计Agent架构 → 选择平台 → 配置Demo
第47页 · 实操指导
Coze组:创建Workflow + 知识库 + 工具
Dify组:创建App + Workflow + 变量映射
讲师巡回辅导
第48页 · 成果展示与点评
每组5分钟展示
讲师点评 + 全班投票最佳方案
第49页 · 核心回顾
Agent = LLM + Memory + Tools + Planner
先单后多,先慢后快
人机协同是必选项
第50页 · 未来趋势
多模态Agent(看图/听音/说话)
Agent-to-Agent协作标准化
企业级Agent平台成熟化
第51页 · Q&A
开放式提问与答疑
Q1 什么是AI Agent(智能体)?
Q2 AI Agent 与传统 chatbot 的本质区别是什么?
Q3 Agent 的核心四大组件是什么?
Q4 Agent 的典型工作流程是怎样的?
Q5 什么是 ReAct(Reasoning + Acting)框架?
Q6 什么是 Tool Use / Function Calling?
Q7 Agent 为什么需要 Planning(规划)模块?
Q8 Agent 的 Reflection(反思/自我纠错)是什么?
Q9 Agent 与 Workflow(工作流)的区别与联系?
Q10 为什么说 Agent = LLM + Memory + Tools + Planner?
Q11 Agent 可以做哪些类型的任务?请列举5种。
Q12 什么类型的任务不适合用 Agent?
Q13 Zero-shot Agent 与 Few-shot Agent 有什么区别?
Q14 什么是 Autonomous Agent(自主智能体)?
Q15 Agent 的“目标对齐(Goal Alignment)”指什么?
Q16 常见开源 Agent 框架有哪些?
Q17 LangChain Agent 的基本组成是什么?
Q18 LangGraph 主要解决什么问题?
Q19 AutoGen 的多智能体对话模式是怎样的?
Q20 CrewAI 中 Agent / Task / Crew 分别指什么?
Q21 国内常见的 Agent 平台有哪些?
Q22 Coze Bot 与 Coze Workflow 有什么区别?
Q23 Dify 中 App / Workflow / Dataset 的关系是什么?
Q24 SaaS Agent 平台与自部署框架各有什么优劣?
Q25 什么是 Agentic Workflow(智能体工作流)?
Q26 低代码 Agent 平台适合哪些场景?
Q27 如何判断一个业务适合“对话 Bot”还是“工作流 Agent”?
Q28 Agent 调用外部 API 通常怎么做?
Q29 什么是 Function Calling / Tool Calling?
Q30 LLM 如何决定“调用哪个工具、传什么参数”?
Q31 如何定义 Tool 的 name / description / parameters(JSON Schema)?
Q32 Tool 返回的结果如何重新注入 LLM 上下文?
Q33 Agent 多步 Tool Call 的执行循环是怎样的?
Q34 如果 Tool 调用失败,Agent 应如何 Fallback?
Q35 什么是 Tool Selection Bias(选错工具)?如何缓解?
Q36 ReAct 的 Thought / Action / Observation 分别指什么?
Q37 CoT(Chain of Thought)与 ReAct 的关系是什么?
Q38 如何限制 Agent 的最大步数以防止死循环?
Q39 多工具并行调用(Parallel Function Call)是什么?
Q40 如何让 Agent 输出结构化结果(JSON Mode / Structured Output)?
Q41 Temperature 对 Agent Planning 有什么影响?
Q42 System Prompt 在 Agent 中起到什么关键作用?
Q43 Agent 的短期记忆(Short-term Memory)指什么?
Q44 长时记忆(Long-term Memory)一般如何存储?
Q45 向量数据库在 Agent 中扮演什么角色?
Q46 如何做 Memory Summarization(对话摘要压缩)?
Q47 窗口超限时常用的裁剪策略有哪些?
Q48 如何为不同用户维护独立的 Memory?
Q49 什么信息应存入长期记忆?
Q50 多 Agent 场景下共享 Memory 如何设计?
Q51 会话隔离(Session Isolation)为什么重要?
Q52 如何清除或重置 Agent Memory?
Q53 什么是 RAG(Retrieval-Augmented Generation)?
Q54 Naive RAG 的基本流程是什么?
Q55 Advanced RAG 包含哪些优化点?
Q56 Embedding 模型的作用是什么?
Q57 Chunk 大小如何影响召回效果?
Q58 Top-K 与 Similarity Threshold 如何设置?
Q59 混合检索(向量 + 关键词 BM25)有什么好处?
Q60 Rerank(重排模型)的作用与用法?
Q61 如何防止 RAG “幻觉引用不存在的内容”?
Q62 知识库更新和版本管理怎么做?
Q63 Agent 何时该走 RAG,何时靠参数化知识?
Q64 Multi-index / Multi-knowledge base 场景如何路由?
Q65 RAG 在客服和合规问答中的注意事项?
Q66 什么是 Multi-Agent System(MAS)?
Q67 单 Agent 与 Multi-Agent 各自适用什么场景?
Q68 常见的 Multi-Agent 拓扑结构有哪些?
Q69 Orchestrator-Worker 模式说明?
Q70 Blackboard(共享黑板)与 Message Passing 通信方式的区别?
Q71 Agent 间如何传递结构化上下文?
Q72 如何让一个 Agent 审核另一个 Agent 的输出(Review Agent)?
Q73 Multi-Agent 中如何避免信息丢失或污染?
Q74 如何做 Agent 间的失败重试与降级?
Q75 CrewAI 中 Process.sequential 与 Process.hierarchical 的区别?
Q76 AutoGen GroupChat 的工作原理?
Q77 Multi-Agent 的延迟与成本控制策略?
Q78 如何评估 Multi-Agent Pipeline 的效果?
Q79 多角色 Agent(分析师/写手/审核者)如何配合完成报告?
Q80 服装品牌“趋势→企划→内容→供应链→客服”属于哪种 Multi-Agent 模式?
Q81 Agent System Prompt 通常包含哪几部分?
Q82 如何编写 Tool Description 才能提高选择准确率?
Q83 Few-shot 示例对 Agent Planning 有什么帮助?
Q84 如何约束 LLM 只输出指定的 JSON 格式?
Q85 “你是一个xxx专家,严格按如下步骤思考…”属于哪种 Prompt 技巧?
Q86 Chain-of-Thought 在复杂任务分解中的作用?
Q87 创意类 Agent(文案生成)与规则类 Agent(数据查询)的 Prompt 差异?
Q88 Agent 调用写操作 API(下单/删数据)需要注意什么?
Q89 Human-in-the-loop(人在回路)指什么?哪些步骤应加入确认?
Q90 Agent 输出如何做内容安全审核(敏感词/合规)?
Q91 Tool 鉴权(API Key / OAuth)如何管理?
Q92 日志与审计(Agent Trace / Tool Call Log)为什么必要?
Q93 如何防止 Prompt Injection 攻击 Agent?
Q94 如何评估 Agent 的成功率?
Q95 Agent 线上监控应关注哪些指标?
Q96 为什么建议“先单 Agent 跑通,再串 Multi-Agent”?
Q97 Temperature 和 Max Tokens 在正式业务中的推荐设置原则?
Q98 新业务引入 Agent 最常被低估的风险是什么?
Q99 Agent 项目 MVP 建议从哪类任务起步?
Q100 你认为未来 1–2 年 Enterprise Agent 落地的关键瓶颈是什么?