AI智能体实战培训全解析

发布时间：2026-06-26 02:48阅读：2

时长：1–2天（理论+实操）

受众：产品经理 / 开发者 / 运营 / 业务负责人

前置要求：了解基础LLM概念

第1页 · 封面

标题：AI智能体（AI Agent）实战培训

副标题：从概念到落地，从Coze到Dify

讲师 / 日期

第2页 · 课程地图

模块概览：概念→架构→实操→Multi-Agent→RAG→避坑→动手

预期收获：理解Agent本质 + 能搭一条完整流水线

第3页 · 从Chatbot到Agent

Chatbot：一问一答，被动响应

Agent：感知→规划→行动→反思，主动完成任务

核心公式：Agent = LLM + Memory + Tools + Planner

第4页 · Agent核心四组件

Perception（感知）：接收用户输入 / 环境信号

Planning（规划）：拆解任务，制定步骤

Action（行动）：调用工具 / API / 写代码

Memory（记忆）：短期对话 + 长期知识

第5页 · ReAct框架详解

Thought（思考）→ Action（行动）→ Observation（观察）→ 循环

对比：CoT只是思考，ReAct会真正动手

第6页 · Agent vs Workflow

Workflow：固定流程图，确定性高

Agent：动态决策，灵活性高

实际落地：两者结合最佳

第7页 · 什么任务适合Agent？

适合：多步骤 / 需调用工具 / 需外部知识 / 结果开放

不适合：纯计算 / 高频低价值 / 必须零误差

第8页 · 互动讨论

你工作中哪些场景可以用Agent？

小组分享 + 讲师点评

第9页 · 开源框架一览

LangChain / AutoGen / CrewAI / OpenDevin

各自特点与适用人群

第10页 · LangChain Agent

AgentExecutor + Tool + LLM

优缺点：生态丰富，但抽象层厚

第11页 · CrewAI

Agent + Task + Crew

Process.sequential vs Process.hierarchical

第12页 · 国内平台：Coze（扣子）

Bot模式 vs Workflow模式

优势：上手快、飞书/微信集成、定时触发

局限：私有化受限

第13页 · 国内平台：Dify

App / Workflow / Dataset 三层结构

优势：开源、可私有化、变量映射灵活

局限：UI复杂度高于Coze

第14页 · 平台对比表

第15页 · 如何选型？

对外发布 + 非技术团队 → Coze

内部系统 + 私有化需求 → Dify

深度定制 + 研究性质 → LangChain/CrewAI

第16页 · Function Calling原理

LLM输出结构化JSON → 决定调哪个工具 + 传什么参数

工具定义：name / description / parameters（JSON Schema）

第17页 · 工具调用循环

用户提问 → LLM决定调工具 → 执行工具 → 结果回注LLM → LLM生成最终回答

可多步、可并行

第18页 · 工具定义最佳实践

description写清楚：何时用、不用会怎样

参数名语义化，加example

Temperature设0.2–0.5

第19页 · 常见失败与处理

选错工具：加强description

参数错误：加few-shot示例

超时/报错：Fallback策略（重试 / 默认值 / 转人工）

第20页 · 实操演示

Coze中创建一个天气查询工具

Dify中创建一个HTTP API工具

第21页 · 三种记忆类型

短期记忆：当前对话窗口

长期记忆：向量数据库存储用户偏好/历史

外部存储：数据库/表格记录业务数据

第22页 · 窗口超限怎么办？

滑动窗口裁剪

对话摘要压缩（Summarization）

关键信息持久化

第23页 · 多用户隔离

Session ID区分

每个用户独立向量空间

不可跨用户读取记忆

第24页 · 实操演示

Coze中配置长期记忆

Dify中通过变量实现会话隔离

第25页 · RAG是什么？

Retrieve → Augment → Generate

解决幻觉 + 利用私有知识

第26页 · 基础RAG流程

文档切块 → Embedding → 向量库存储

用户提问 → 向量检索 → 拼接上下文 → LLM回答

第27页 · 进阶RAG优化

查询改写（Query Rewrite）

混合检索（向量 + BM25）

重排序（Rerank）

第28页 · 知识库维护

Chunk大小：500–1000字符

定期更新 + 版本管理

多知识库路由（按部门/品类）

第29页 · 实操演示

Coze中创建知识库并绑定Agent

Dify中Dataset配置 + 召回测试

第30页 · 为什么需要Multi-Agent？

单一Agent难以覆盖长链路

职责分离 → Prompt更短 → 输出更稳

可单独调试、迭代

第31页 · 常见拓扑结构

串行流水线（Pipeline）

中心调度+子Agent（Hub-Spoke）

辩论/对抗（Debate）

第32页 · 串行模式详解

A输出 → B输入 → C输入

适合：前后依赖明确的流程

案例：服装品牌趋势→企划→内容→供应链→客服

第33页 · 中心调度模式

Orchestrator分配任务 → Worker执行 → 汇总

适合：并行任务 + 结果聚合

第34页 · Agent间通信

JSON结构化传递（推荐）

共享数据库/表格

消息队列（高级）

第35页 · Multi-Agent避坑

变量命名不一致 → 下游拿不到数据

无Fallback → 单点故障整条断

角色边界不清 → 互相越权

第36页 · 实操演示

Coze Workflow串联5个Agent

Dify中Agent节点 + 变量映射

第37页 · Agent System Prompt结构

角色定义：你是谁

任务描述：你要做什么

约束条件：不能做什么

输出格式：JSON / Markdown

工具列表：可用工具有哪些

第38页 · 提高工具选择准确率

Tool Description写清楚使用场景

加few-shot示例

冲突工具增加优先级说明

第39页 · 输出格式控制

"请严格按照以下JSON格式输出，不要包裹markdown代码块"

Temperature ≤ 0.3

必要时用OutputParser

第40页 · 安全红线

写操作必须Human-in-the-loop

敏感信息脱敏

Prompt Injection防护

第41页 · 日志与审计

记录每次Tool Call + 输入输出

异常告警

定期复盘Agent决策

第42页 · 评估指标

任务完成率

平均步数

工具调用准确率

用户满意度

第43页 · 线上监控

延迟 / Token消耗 / 失败率

兜底率（转人工比例）

异常检测 + 告警

第44页 · 落地路线图

第一阶段：单Agent跑通（1–2周）

第二阶段：串成Multi-Agent（2–4周）

第三阶段：灰度上线 + 人工兜底（1–2月）

第四阶段：持续优化 + 扩大场景

第45页 · 常见踩坑总结

低估理解成本

忽视维护成本

幻觉未充分治理

没有人工兜底就全量上线

第46页 · 分组任务说明

每组选一个业务场景（客服/内容生产/数据分析等）

设计Agent架构 → 选择平台 → 配置Demo

第47页 · 实操指导

Coze组：创建Workflow + 知识库 + 工具

Dify组：创建App + Workflow + 变量映射

讲师巡回辅导

第48页 · 成果展示与点评

每组5分钟展示

讲师点评 + 全班投票最佳方案

第49页 · 核心回顾

Agent = LLM + Memory + Tools + Planner

先单后多，先慢后快

人机协同是必选项

第50页 · 未来趋势

多模态Agent（看图/听音/说话）

Agent-to-Agent协作标准化

企业级Agent平台成熟化

第51页 · Q&A

开放式提问与答疑

Q1 什么是AI Agent（智能体）？

Q2 AI Agent 与传统 chatbot 的本质区别是什么？

Q3 Agent 的核心四大组件是什么？

Q4 Agent 的典型工作流程是怎样的？

Q5 什么是 ReAct（Reasoning + Acting）框架？

Q6 什么是 Tool Use / Function Calling？

Q7 Agent 为什么需要 Planning（规划）模块？

Q8 Agent 的 Reflection（反思/自我纠错）是什么？

Q9 Agent 与 Workflow（工作流）的区别与联系？

Q10 为什么说 Agent = LLM + Memory + Tools + Planner？

Q11 Agent 可以做哪些类型的任务？请列举5种。

Q12 什么类型的任务不适合用 Agent？

Q13 Zero-shot Agent 与 Few-shot Agent 有什么区别？

Q14 什么是 Autonomous Agent（自主智能体）？

Q15 Agent 的“目标对齐（Goal Alignment）”指什么？

Q16 常见开源 Agent 框架有哪些？

Q17 LangChain Agent 的基本组成是什么？

Q18 LangGraph 主要解决什么问题？

Q19 AutoGen 的多智能体对话模式是怎样的？

Q20 CrewAI 中 Agent / Task / Crew 分别指什么？

Q21 国内常见的 Agent 平台有哪些？

Q22 Coze Bot 与 Coze Workflow 有什么区别？

Q23 Dify 中 App / Workflow / Dataset 的关系是什么？

Q24 SaaS Agent 平台与自部署框架各有什么优劣？

Q25 什么是 Agentic Workflow（智能体工作流）？

Q26 低代码 Agent 平台适合哪些场景？

Q27 如何判断一个业务适合“对话 Bot”还是“工作流 Agent”？

Q28 Agent 调用外部 API 通常怎么做？

Q29 什么是 Function Calling / Tool Calling？

Q30 LLM 如何决定“调用哪个工具、传什么参数”？

Q31 如何定义 Tool 的 name / description / parameters（JSON Schema）？

Q32 Tool 返回的结果如何重新注入 LLM 上下文？

Q33 Agent 多步 Tool Call 的执行循环是怎样的？

Q34 如果 Tool 调用失败，Agent 应如何 Fallback？

Q35 什么是 Tool Selection Bias（选错工具）？如何缓解？

Q36 ReAct 的 Thought / Action / Observation 分别指什么？

Q37 CoT（Chain of Thought）与 ReAct 的关系是什么？

Q38 如何限制 Agent 的最大步数以防止死循环？

Q39 多工具并行调用（Parallel Function Call）是什么？

Q40 如何让 Agent 输出结构化结果（JSON Mode / Structured Output）？

Q41 Temperature 对 Agent Planning 有什么影响？

Q42 System Prompt 在 Agent 中起到什么关键作用？

Q43 Agent 的短期记忆（Short-term Memory）指什么？

Q44 长时记忆（Long-term Memory）一般如何存储？

Q45 向量数据库在 Agent 中扮演什么角色？

Q46 如何做 Memory Summarization（对话摘要压缩）？

Q47 窗口超限时常用的裁剪策略有哪些？

Q48 如何为不同用户维护独立的 Memory？

Q49 什么信息应存入长期记忆？

Q50 多 Agent 场景下共享 Memory 如何设计？

Q51 会话隔离（Session Isolation）为什么重要？

Q52 如何清除或重置 Agent Memory？

Q53 什么是 RAG（Retrieval-Augmented Generation）？

Q54 Naive RAG 的基本流程是什么？

Q55 Advanced RAG 包含哪些优化点？

Q56 Embedding 模型的作用是什么？

Q57 Chunk 大小如何影响召回效果？

Q58 Top-K 与 Similarity Threshold 如何设置？

Q59 混合检索（向量 + 关键词 BM25）有什么好处？

Q60 Rerank（重排模型）的作用与用法？

Q61 如何防止 RAG “幻觉引用不存在的内容”？

Q62 知识库更新和版本管理怎么做？

Q63 Agent 何时该走 RAG，何时靠参数化知识？

Q64 Multi-index / Multi-knowledge base 场景如何路由？

Q65 RAG 在客服和合规问答中的注意事项？

Q66 什么是 Multi-Agent System（MAS）？

Q67 单 Agent 与 Multi-Agent 各自适用什么场景？

Q68 常见的 Multi-Agent 拓扑结构有哪些？

Q69 Orchestrator-Worker 模式说明？

Q70 Blackboard（共享黑板）与 Message Passing 通信方式的区别？

Q71 Agent 间如何传递结构化上下文？

Q72 如何让一个 Agent 审核另一个 Agent 的输出（Review Agent）？

Q73 Multi-Agent 中如何避免信息丢失或污染？

Q74 如何做 Agent 间的失败重试与降级？

Q75 CrewAI 中 Process.sequential 与 Process.hierarchical 的区别？

Q76 AutoGen GroupChat 的工作原理？

Q77 Multi-Agent 的延迟与成本控制策略？

Q78 如何评估 Multi-Agent Pipeline 的效果？

Q79 多角色 Agent（分析师/写手/审核者）如何配合完成报告？

Q80 服装品牌“趋势→企划→内容→供应链→客服”属于哪种 Multi-Agent 模式？

Q81 Agent System Prompt 通常包含哪几部分？

Q82 如何编写 Tool Description 才能提高选择准确率？

Q83 Few-shot 示例对 Agent Planning 有什么帮助？

Q84 如何约束 LLM 只输出指定的 JSON 格式？

Q85 “你是一个xxx专家，严格按如下步骤思考…”属于哪种 Prompt 技巧？

Q86 Chain-of-Thought 在复杂任务分解中的作用？

Q87 创意类 Agent（文案生成）与规则类 Agent（数据查询）的 Prompt 差异？

Q88 Agent 调用写操作 API（下单/删数据）需要注意什么？

Q89 Human-in-the-loop（人在回路）指什么？哪些步骤应加入确认？

Q90 Agent 输出如何做内容安全审核（敏感词/合规）？

Q91 Tool 鉴权（API Key / OAuth）如何管理？

Q92 日志与审计（Agent Trace / Tool Call Log）为什么必要？

Q93 如何防止 Prompt Injection 攻击 Agent？

Q94 如何评估 Agent 的成功率？

Q95 Agent 线上监控应关注哪些指标？

Q96 为什么建议“先单 Agent 跑通，再串 Multi-Agent”？

Q97 Temperature 和 Max Tokens 在正式业务中的推荐设置原则？

Q98 新业务引入 Agent 最常被低估的风险是什么？

Q99 Agent 项目 MVP 建议从哪类任务起步？

Q100 你认为未来 1–2 年 Enterprise Agent 落地的关键瓶颈是什么？

← 上一篇：智能陪伴赋能社会管理下一篇：AI获客实战手册：五维全链路引流策略解析 →