标签

AI智能体实战培训全解析

发布时间:2026-06-26 02:48阅读:2

时长:1–2天(理论+实操)

受众:产品经理 / 开发者 / 运营 / 业务负责人

前置要求:了解基础LLM概念

第1页 · 封面

标题:AI智能体(AI Agent)实战培训

副标题:从概念到落地,从Coze到Dify

讲师 / 日期

第2页 · 课程地图

模块概览:概念→架构→实操→Multi-Agent→RAG→避坑→动手

预期收获:理解Agent本质 + 能搭一条完整流水线

第3页 · 从Chatbot到Agent

Chatbot:一问一答,被动响应

Agent:感知→规划→行动→反思,主动完成任务

核心公式:Agent = LLM + Memory + Tools + Planner

第4页 · Agent核心四组件

Perception(感知):接收用户输入 / 环境信号

Planning(规划):拆解任务,制定步骤

Action(行动):调用工具 / API / 写代码

Memory(记忆):短期对话 + 长期知识

第5页 · ReAct框架详解

Thought(思考)→ Action(行动)→ Observation(观察)→ 循环

对比:CoT只是思考,ReAct会真正动手

第6页 · Agent vs Workflow

Workflow:固定流程图,确定性高

Agent:动态决策,灵活性高

实际落地:两者结合最佳

第7页 · 什么任务适合Agent?

适合:多步骤 / 需调用工具 / 需外部知识 / 结果开放

不适合:纯计算 / 高频低价值 / 必须零误差

第8页 · 互动讨论

你工作中哪些场景可以用Agent?

小组分享 + 讲师点评

第9页 · 开源框架一览

LangChain / AutoGen / CrewAI / OpenDevin

各自特点与适用人群

第10页 · LangChain Agent

AgentExecutor + Tool + LLM

优缺点:生态丰富,但抽象层厚

第11页 · CrewAI

Agent + Task + Crew

Process.sequential vs Process.hierarchical

第12页 · 国内平台:Coze(扣子)

Bot模式 vs Workflow模式

优势:上手快、飞书/微信集成、定时触发

局限:私有化受限

第13页 · 国内平台:Dify

App / Workflow / Dataset 三层结构

优势:开源、可私有化、变量映射灵活

局限:UI复杂度高于Coze

第14页 · 平台对比表

第15页 · 如何选型?

对外发布 + 非技术团队 → Coze

内部系统 + 私有化需求 → Dify

深度定制 + 研究性质 → LangChain/CrewAI

第16页 · Function Calling原理

LLM输出结构化JSON → 决定调哪个工具 + 传什么参数

工具定义:name / description / parameters(JSON Schema)

第17页 · 工具调用循环

用户提问 → LLM决定调工具 → 执行工具 → 结果回注LLM → LLM生成最终回答

可多步、可并行

第18页 · 工具定义最佳实践

description写清楚:何时用、不用会怎样

参数名语义化,加example

Temperature设0.2–0.5

第19页 · 常见失败与处理

选错工具:加强description

参数错误:加few-shot示例

超时/报错:Fallback策略(重试 / 默认值 / 转人工)

第20页 · 实操演示

Coze中创建一个天气查询工具

Dify中创建一个HTTP API工具

第21页 · 三种记忆类型

短期记忆:当前对话窗口

长期记忆:向量数据库存储用户偏好/历史

外部存储:数据库/表格记录业务数据

第22页 · 窗口超限怎么办?

滑动窗口裁剪

对话摘要压缩(Summarization)

关键信息持久化

第23页 · 多用户隔离

Session ID区分

每个用户独立向量空间

不可跨用户读取记忆

第24页 · 实操演示

Coze中配置长期记忆

Dify中通过变量实现会话隔离

第25页 · RAG是什么?

Retrieve → Augment → Generate

解决幻觉 + 利用私有知识

第26页 · 基础RAG流程

文档切块 → Embedding → 向量库存储

用户提问 → 向量检索 → 拼接上下文 → LLM回答

第27页 · 进阶RAG优化

查询改写(Query Rewrite)

混合检索(向量 + BM25)

重排序(Rerank)

第28页 · 知识库维护

Chunk大小:500–1000字符

定期更新 + 版本管理

多知识库路由(按部门/品类)

第29页 · 实操演示

Coze中创建知识库并绑定Agent

Dify中Dataset配置 + 召回测试

第30页 · 为什么需要Multi-Agent?

单一Agent难以覆盖长链路

职责分离 → Prompt更短 → 输出更稳

可单独调试、迭代

第31页 · 常见拓扑结构

串行流水线(Pipeline)

中心调度+子Agent(Hub-Spoke)

辩论/对抗(Debate)

第32页 · 串行模式详解

A输出 → B输入 → C输入

适合:前后依赖明确的流程

案例:服装品牌 趋势→企划→内容→供应链→客服

第33页 · 中心调度模式

Orchestrator分配任务 → Worker执行 → 汇总

适合:并行任务 + 结果聚合

第34页 · Agent间通信

JSON结构化传递(推荐)

共享数据库/表格

消息队列(高级)

第35页 · Multi-Agent避坑

变量命名不一致 → 下游拿不到数据

无Fallback → 单点故障整条断

角色边界不清 → 互相越权

第36页 · 实操演示

Coze Workflow串联5个Agent

Dify中Agent节点 + 变量映射

第37页 · Agent System Prompt结构

角色定义:你是谁

任务描述:你要做什么

约束条件:不能做什么

输出格式:JSON / Markdown

工具列表:可用工具有哪些

第38页 · 提高工具选择准确率

Tool Description写清楚使用场景

加few-shot示例

冲突工具增加优先级说明

第39页 · 输出格式控制

"请严格按照以下JSON格式输出,不要包裹markdown代码块"

Temperature ≤ 0.3

必要时用OutputParser

第40页 · 安全红线

写操作必须Human-in-the-loop

敏感信息脱敏

Prompt Injection防护

第41页 · 日志与审计

记录每次Tool Call + 输入输出

异常告警

定期复盘Agent决策

第42页 · 评估指标

任务完成率

平均步数

工具调用准确率

用户满意度

第43页 · 线上监控

延迟 / Token消耗 / 失败率

兜底率(转人工比例)

异常检测 + 告警

第44页 · 落地路线图

第一阶段:单Agent跑通(1–2周)

第二阶段:串成Multi-Agent(2–4周)

第三阶段:灰度上线 + 人工兜底(1–2月)

第四阶段:持续优化 + 扩大场景

第45页 · 常见踩坑总结

低估理解成本

忽视维护成本

幻觉未充分治理

没有人工兜底就全量上线

第46页 · 分组任务说明

每组选一个业务场景(客服/内容生产/数据分析等)

设计Agent架构 → 选择平台 → 配置Demo

第47页 · 实操指导

Coze组:创建Workflow + 知识库 + 工具

Dify组:创建App + Workflow + 变量映射

讲师巡回辅导

第48页 · 成果展示与点评

每组5分钟展示

讲师点评 + 全班投票最佳方案

第49页 · 核心回顾

Agent = LLM + Memory + Tools + Planner

先单后多,先慢后快

人机协同是必选项

第50页 · 未来趋势

多模态Agent(看图/听音/说话)

Agent-to-Agent协作标准化

企业级Agent平台成熟化

第51页 · Q&A

开放式提问与答疑

Q1 什么是AI Agent(智能体)?

Q2 AI Agent 与传统 chatbot 的本质区别是什么?

Q3 Agent 的核心四大组件是什么?

Q4 Agent 的典型工作流程是怎样的?

Q5 什么是 ReAct(Reasoning + Acting)框架?

Q6 什么是 Tool Use / Function Calling?

Q7 Agent 为什么需要 Planning(规划)模块?

Q8 Agent 的 Reflection(反思/自我纠错)是什么?

Q9 Agent 与 Workflow(工作流)的区别与联系?

Q10 为什么说 Agent = LLM + Memory + Tools + Planner?

Q11 Agent 可以做哪些类型的任务?请列举5种。

Q12 什么类型的任务不适合用 Agent?

Q13 Zero-shot Agent 与 Few-shot Agent 有什么区别?

Q14 什么是 Autonomous Agent(自主智能体)?

Q15 Agent 的“目标对齐(Goal Alignment)”指什么?

Q16 常见开源 Agent 框架有哪些?

Q17 LangChain Agent 的基本组成是什么?

Q18 LangGraph 主要解决什么问题?

Q19 AutoGen 的多智能体对话模式是怎样的?

Q20 CrewAI 中 Agent / Task / Crew 分别指什么?

Q21 国内常见的 Agent 平台有哪些?

Q22 Coze Bot 与 Coze Workflow 有什么区别?

Q23 Dify 中 App / Workflow / Dataset 的关系是什么?

Q24 SaaS Agent 平台与自部署框架各有什么优劣?

Q25 什么是 Agentic Workflow(智能体工作流)?

Q26 低代码 Agent 平台适合哪些场景?

Q27 如何判断一个业务适合“对话 Bot”还是“工作流 Agent”?

Q28 Agent 调用外部 API 通常怎么做?

Q29 什么是 Function Calling / Tool Calling?

Q30 LLM 如何决定“调用哪个工具、传什么参数”?

Q31 如何定义 Tool 的 name / description / parameters(JSON Schema)?

Q32 Tool 返回的结果如何重新注入 LLM 上下文?

Q33 Agent 多步 Tool Call 的执行循环是怎样的?

Q34 如果 Tool 调用失败,Agent 应如何 Fallback?

Q35 什么是 Tool Selection Bias(选错工具)?如何缓解?

Q36 ReAct 的 Thought / Action / Observation 分别指什么?

Q37 CoT(Chain of Thought)与 ReAct 的关系是什么?

Q38 如何限制 Agent 的最大步数以防止死循环?

Q39 多工具并行调用(Parallel Function Call)是什么?

Q40 如何让 Agent 输出结构化结果(JSON Mode / Structured Output)?

Q41 Temperature 对 Agent Planning 有什么影响?

Q42 System Prompt 在 Agent 中起到什么关键作用?

Q43 Agent 的短期记忆(Short-term Memory)指什么?

Q44 长时记忆(Long-term Memory)一般如何存储?

Q45 向量数据库在 Agent 中扮演什么角色?

Q46 如何做 Memory Summarization(对话摘要压缩)?

Q47 窗口超限时常用的裁剪策略有哪些?

Q48 如何为不同用户维护独立的 Memory?

Q49 什么信息应存入长期记忆?

Q50 多 Agent 场景下共享 Memory 如何设计?

Q51 会话隔离(Session Isolation)为什么重要?

Q52 如何清除或重置 Agent Memory?

Q53 什么是 RAG(Retrieval-Augmented Generation)?

Q54 Naive RAG 的基本流程是什么?

Q55 Advanced RAG 包含哪些优化点?

Q56 Embedding 模型的作用是什么?

Q57 Chunk 大小如何影响召回效果?

Q58 Top-K 与 Similarity Threshold 如何设置?

Q59 混合检索(向量 + 关键词 BM25)有什么好处?

Q60 Rerank(重排模型)的作用与用法?

Q61 如何防止 RAG “幻觉引用不存在的内容”?

Q62 知识库更新和版本管理怎么做?

Q63 Agent 何时该走 RAG,何时靠参数化知识?

Q64 Multi-index / Multi-knowledge base 场景如何路由?

Q65 RAG 在客服和合规问答中的注意事项?

Q66 什么是 Multi-Agent System(MAS)?

Q67 单 Agent 与 Multi-Agent 各自适用什么场景?

Q68 常见的 Multi-Agent 拓扑结构有哪些?

Q69 Orchestrator-Worker 模式说明?

Q70 Blackboard(共享黑板)与 Message Passing 通信方式的区别?

Q71 Agent 间如何传递结构化上下文?

Q72 如何让一个 Agent 审核另一个 Agent 的输出(Review Agent)?

Q73 Multi-Agent 中如何避免信息丢失或污染?

Q74 如何做 Agent 间的失败重试与降级?

Q75 CrewAI 中 Process.sequential 与 Process.hierarchical 的区别?

Q76 AutoGen GroupChat 的工作原理?

Q77 Multi-Agent 的延迟与成本控制策略?

Q78 如何评估 Multi-Agent Pipeline 的效果?

Q79 多角色 Agent(分析师/写手/审核者)如何配合完成报告?

Q80 服装品牌“趋势→企划→内容→供应链→客服”属于哪种 Multi-Agent 模式?

Q81 Agent System Prompt 通常包含哪几部分?

Q82 如何编写 Tool Description 才能提高选择准确率?

Q83 Few-shot 示例对 Agent Planning 有什么帮助?

Q84 如何约束 LLM 只输出指定的 JSON 格式?

Q85 “你是一个xxx专家,严格按如下步骤思考…”属于哪种 Prompt 技巧?

Q86 Chain-of-Thought 在复杂任务分解中的作用?

Q87 创意类 Agent(文案生成)与规则类 Agent(数据查询)的 Prompt 差异?

Q88 Agent 调用写操作 API(下单/删数据)需要注意什么?

Q89 Human-in-the-loop(人在回路)指什么?哪些步骤应加入确认?

Q90 Agent 输出如何做内容安全审核(敏感词/合规)?

Q91 Tool 鉴权(API Key / OAuth)如何管理?

Q92 日志与审计(Agent Trace / Tool Call Log)为什么必要?

Q93 如何防止 Prompt Injection 攻击 Agent?

Q94 如何评估 Agent 的成功率?

Q95 Agent 线上监控应关注哪些指标?

Q96 为什么建议“先单 Agent 跑通,再串 Multi-Agent”?

Q97 Temperature 和 Max Tokens 在正式业务中的推荐设置原则?

Q98 新业务引入 Agent 最常被低估的风险是什么?

Q99 Agent 项目 MVP 建议从哪类任务起步?

Q100 你认为未来 1–2 年 Enterprise Agent 落地的关键瓶颈是什么?