AI工作流构建:从流程到执行的转变
当前模型能力已足够强大,但许多人仍认为AI表现不佳。问题并非出在模型或提示词上,而在于无法将任务拆解为AI可执行的小任务。
实际上,如今的模型已能胜任大多数任务。但许多人仍觉得模型效果不好、输出不可靠。根据过往咨询经验,大多数人缺乏的是将大任务拆解为AI可执行小任务的能力。
这看似简单,但请相信:如果你是技术人员,良好的任务拆解能力有助于构建更稳定的系统;如果你是非技术人员,更需掌握如何将日常工作细化并委派给AI,而不是将大任务直接丢给AI,导致其无法处理。
很多人容易混淆三者,但它们的层级和功能完全不同。
是写给人看的流程说明。它告诉你第一步做什么、第二步做什么、遇到特殊情况如何处理,旁边还附带许多小提示和经验分享。
这类文档对人类来说毫无问题,因为人脑会自动补充上下文,判断哪些步骤可以省略,哪些必须执行。
例如流程中写道:
申请完成后送主管审批。
看到这句话,你可能判断:如果是小额两百元以内,主管可能希望你不要打扰他;但如果金额超过五千,就必须按流程执行。
这些判断可以写入流程文件,但需要详细列出例外情况。更常见的是,维护文件不如口头提醒新同事来得方便。这种情况在中小企业尤为普遍。
但这样的流程文件对AI而言,就是一堆非结构化文字,理解成本高,执行时容易遗漏。只要没有明确写出,AI不会知道:
本质上是将做事的方法、判断标准、经验教训打包成一个文件夹交给AI。通常包含三个部分:
一个AI技能包对应的是单一任务,而非整条工作流。例如:
从名称就能看出:何时触发、解决什么问题。
设计技能包时最关键的是范围控制。范围过大:什么都能做,但什么都做不好。范围过小:每一步都要读取技能包,效率反而下降。
这是第三层,也是最重要的一层,因为智能工作流不是单个提示词,而是一条完整的生产线。
里面可能包含:多个AI、多个技能包、多种工具、数据库、API、自动化脚本。
有人负责理解问题,有人负责查资料,有人负责执行动作,有人负责检查结果,有人负责生成报告。整个过程像一间工厂,只不过里面工作的都是AI。
人工流程文档 = 给人看的操作流程
AI技能包 = 给AI执行的单项能力
智能工作流 = 把多个技能包和工具串起来的一条生产线
当整条生产线运行完毕,任务也就完成了。本文真正要讲的是:如何把原本给人看的流程文件,改造成AI能够长期稳定执行的智能工作流。
很多人初次接触AI自动化,直觉是:找最强模型、把任务整包丢进去,让它从头做到尾。这就是所谓的:万能AI。
例如你告诉它:「帮我优化整个开发流程。」它一定会做点什么出来。可能:
但问题是:你根本不知道它到底做了什么。哪一步判断正确、哪一步判断错误、哪一步调用工具失败、哪一步纯属自己幻想,全部都看不见。
任务丢进去 → 结果吐出来 → 中间发生什么没人知道
这就是典型黑箱。我见过太多新手卡在这里,他们的第一反应永远是:再换一个更强模型,或者再写一个更长的提示词。
但其实问题既不在模型,也不在提示词。而是:任务太大、太模糊,所以每次执行都像买彩票。
反过来,如果把任务拆成很多小任务,情况会完全不一样。
例如:同样是处理客户请求,你可以拆成四个独立AI:
每个AI都很笨,但每个AI都只做一件事,因此特别稳定,出了问题也很好查。例如发现客户分类错误,你直接回去改分类规则就好。
现在很多企业级AI系统本质上都在做同样的事:把复杂流程拆成多个节点,每个节点只负责一小段工作。
为什么大公司不用万能AI?
因为他们要上线、要稳定、要能追踪问题、要能修复问题。而一个看不到内部过程的黑箱,永远达不到正式上线标准。
所以,几十年前的软件工程理念「分而治之」,到了AI时代反而更重要。因为你不是在训练一个万能超人,而是在设计一条真正能长期运行的生产线。
知道为什么要拆之后,接下来的重点就是怎么拆。我们用「洗衣服」这件事当作例子,一步步来。
把人工流程改成AI能够读懂的版本。重点有三个:
#### ① 参数化
不要在流程里写死:「一定要用普通模式。」因为这样流程只能覆盖一种情况。应该改成:模式、温度、时长这些参数。
例如:
这样同一份流程就能覆盖各种情况。流程一旦写死,容错率就会很低。我见过太多人把技能包写成只适用于一种特殊场景,结果换个情况就直接失效。
#### ② MUST / SHOULD / MAY
这是互联网协议里非常经典的一套规则写法,拿来写AI工作流特别好用,因为它强迫你把每条规则的重要程度想清楚。
这种写法最大的好处是让AI知道:哪些事情不能商量,哪些事情可以灵活处理。
#### ③ 结构化格式
把流程拆成固定区块,例如:
每个部分单独放。这样:人能看懂、AI也能看懂,未来接入各种工具也方便。
处理到这里,你手上的东西就不再是一篇说明文,而是一份AI真正能够执行的流程规范。
接下来开始拆。把整个流程拆成多个步骤,每个步骤都是流水线里的一个节点。
洗衣服这件事,其实可以拆成:
每个步骤:有输入、有输出、能独立运行、能独立排错,甚至可以单独替换。
为什么一定要独立?因为出问题的时候特别好修。例如分类阶段出错,把白色衣服判成深色衣服,你只需要修分类逻辑,后面的洗衣设置、晾晒逻辑、烘干逻辑全部不用动。
如果你用的是万能AI,所有逻辑混在一起,一旦出错,只能整体重写,因为根本不知道是哪一段出了问题。
除此之外,每个节点都可以独立变成一个AI技能包:
三个技能包都很简单,但组合起来,就是完整的洗衣流程。
那这些节点之间靠什么连接?答案是:中间结果。
例如分类完成后,输出一份结构化数据:
```json
{
"white": ["shirt"],
"dark": ["pants"],
"delicate": ["wool"]
}
```
这份结构化数据,直接变成下一个节点的输入。所以节点之间连接靠的不是猜测,也不是心灵感应,而是:
输入 → 处理中 → 输出 → 下一步输入
清清楚楚。
这是很多人最容易忽略的一步,但实际上,这是最重要的一步。因为你的第一版流程,一定有问题,一定!
这里有个很重要的概念:默会知识。简单说:就是你一直在使用,但很难完整写出来的经验。
很多人以为自己已经把流程写完整了,实际上根本没有,因为脑子里还有大量隐性经验,自己都没意识到。什么时候会发现?AI撞墙的时候。
例如:你写了一份洗衣流程,结果第一次执行的时候AI把所有纯棉衣服都丢进高温烘干机,衣服全部缩水。这时候你才发现:原来流程里漏写了一条规则。
纯棉衣物禁止高温烘干
于是补进去,再执行。第二次发现AI没有使用洗衣袋,再补一条:
精细衣物必须放洗衣袋
然后继续跑、继续补、继续修。这个过程就叫:迭代。
真正有效的流程从来不是关在房间里幻想出来的,而是:
运行 → 出错 → 修复 → 运行 → 再出错 → 再修复 → 不断循环
我曾经见过一个团队花两个月写了一份所谓的完美流程,结果第一次上线就崩,因为他们写的全是想象中的场景,但现实根本不会发生。后来改成:先做最简版本 → 不断测试 → 不断迭代 → 两周就上线,而且效果更好。
所以速度的关键不是写得多完美,而是迭代得有多快。
最后一步,决定你的AI系统到底是演示项目,还是真正能上线运行。因为再漂亮的流程,如果接不到真实工具,它永远只是一份文档。
洗衣服的例子里,工具是:洗衣机、烘干机、天气服务。AI不仅要知道该怎么做,还要真的能执行。
而对于企业来说,工具通常包括:数据库、API、文件系统、Git仓库、工单系统、CRM系统、ERP系统等等。
但问题来了:每家公司系统都不同,怎么统一?
答案就是:MCP(模型上下文协议)。可以把它理解成:AI世界的USB-C接口。
以前:每个AI工具都有自己的连接方式,换个平台就要重做一遍。现在:只要支持MCP,大家都按同一个标准连接。你今天做好的工具,明天ChatGPT能用、Claude能用、Cursor能用,其他AI平台也能用。
这就是MCP存在的意义:统一标准、统一连接方式。
工具接好以后,还有最后一步:人工确认节点,也叫Human in the Loop。简单理解:某些关键决策,AI必须停下来等人确认。
例如:
这种情况AI不应该自己决定,必须让人类拍板。因为无论流程设计得多好,总会有极端情况,总会有例外。
人工确认节点的意义就是:把风险控制在可接受范围内,这样整条工作流才不会变成失控机器。而是:
人类负责方向 → AI负责执行 = 真正实现协作
讲完方法论,我们来看一个真正能落地的例子。
假设你在一家两百人的公司工作,每天都会收到各种请求:邮件、Slack消息、飞书、企业微信、表单提交。内容大概长这样:
我要申请新系统权限。
这张发票能不能报销。
下周有新同事入职,需要开哪些账号。
帮我开一个测试环境。
如果是人工处理,你的流程大概是:打开工单 → 看内容 → 判断属于哪个部门 → 判断优先级 → 找负责人 → 回复申请人。每天都在重复,没有技术难度,但特别耗时间。而这种事情最适合交给AI。
把这件事写成一份流程规范。例如:
内部请求分类
输入参数:
规则:
```json
{
"category": "IT",
"priority": "High",
"need_clarification": false
}
```
如果信息不足,则MUST自动生成需要补充的问题,例如:
需要哪个系统权限?
预计使用多久?
是否经过主管批准?
这样,第一份规范就完成了。
不要让一个AI全做,拆!
这样:分类错了,修分类逻辑;回复写得不好,修回复逻辑,互不影响。
第一版一定不准,没关系,直接跑。例如你发现:「发票报销」总被判成行政请求。那就补规则,再跑。
又发现:优先级全部变成高。继续补规则,再跑。三轮、五轮、十轮,准确率自然会上去。
最后,把整个流程接入公司工具:
工单系统 → 分类 → 生成回复 → 写回Notion → 通知负责人
如果涉及大额财务、权限变更、管理员操作,则增加人工确认节点。
最终形成:
读取工单 → 自动分类 → 生成回复 → 写回系统 → 必要时人工确认
原本需要人工每天处理几十次的工作,就变成了自动运行的工作流,而且出了问题还能快速定位。
前面提到的MCP,现在已经不是实验项目,而是正在成为行业标准。
MCP全称:Model Context Protocol,中文:模型上下文协议。你可以把它理解成:
AI世界的USB-C接口
以前:每个AI平台都有自己的接口,不同工具之间很难互通。现在:只要支持MCP,大家都能按统一标准连接。
例如:你做了一个数据库查询工具,支持MCP后,ChatGPT能调用、Claude能调用、Cursor能调用、Codex能调用,不需要为每个平台单独开发。
为什么越来越多人在聊MCP?因为它解决的是:
AI怎么连接现实世界
模型再聪明,如果不能查数据库、调接口、读文件、发消息,那也只是聊天机器人。而MCP正在让AI从聊天机器人变成真正能干活的工具。
再往大一点看,很多大型企业已经开始采用AI工作流、多AI协作系统、MCP工具生态,来处理IT支持、人力资源、客户服务、内部审批等业务流程。
所以:学习工作流设计,不是为了追热点,而是在学习未来几年越来越重要的一项能力。
你不需要今天就把公司所有流程自动化,那样大概率会把自己累死。你只需要做一件事:找出你最讨厌、最重复、最无聊的一项工作。
例如:
挑一个,先做。不要追求一步到位,不要追求100%自动化,先做到:节省30%时间就已经很成功了。然后:不断补规则、不断迭代、不断优化,慢慢把它变成稳定的工作流。
很多人以为自己在学习怎么使用AI,其实真正值钱的是:
学习如何把工作拆解成AI能够长期执行的流程
模型会越来越强,工具会越来越多,平台会不断变化。但:流程设计能力、任务拆解能力、工作流思维,这些能力只会越来越值钱。
智能工作流的核心不是寻找最强模型,也不是写最长的提示词,而是把一个大任务拆成很多清晰的小任务,再通过标准化、拆解、迭代和整合,把原本只能靠人完成的流程,变成AI能够长期稳定执行的生产线。
未来最值钱的能力,不是会用AI,而是会设计AI能够运行的工作流。