AI 工程化新纪元:Workflow 模式与四大实战工具解析
AI 实战利器
2026-05-29
今日最受瞩目的动态,莫过于 Anthropic 在 Claude Code 中低调上线了 Workflow 模式——该模式利用 JavaScript 脚本替代自然语言来编排多智能体协作,这是一次足以与 MCP、Skills 相提并论的范式革新。此外,另有三款工具同样聚焦于“推动智能体从对话交互迈向工程系统”这一核心方向。
Claude Code Workflow — 以代码驱动取代提示词编排多智能体
尽管在 5 月中旬发布的 Claude Code v2.1.147 更新说明中,Anthropic 移除了对该功能的描述,但其实际上已稳定可用:即 Workflow 模式。其核心在于将多智能体的编排从依赖自然语言的“现场指挥”,升级为基于 JavaScript 脚本的“代码驱动”——由代码掌控控制流(涵盖循环、条件判断、并行处理及重试机制),而大语言模型仅专注于每个步骤内的具体决策。
为何此举意义重大?当前所有 AI 智能体编排方案均存在一个根本性短板:主智能体需将所有子智能体的输出拼接至自身的上下文窗口中,子智能体数量越多,上下文越长,导致性能下降且 Token 成本激增(学界称之为“中间迷失”问题)。Workflow 模式将此负担从 LLM 上下文中剥离,转移至 JavaScript 变量中——编排脚本本身不消耗模型 Token,仅在调用每个 agent() 时产生消耗。任务完成后仅向用户返回最终结果,中间所有智能体的对话历史均不进入主会话。
使用时只需配置一个环境变量以启动 Claude Code,随后在提示词中包含 workflow 关键字,或直接启用 ultracode 模式:
Claude Code 并非直接执行任务,而是先生成一份完整的 JavaScript 脚本。该脚本囊括元数据、多个执行阶段(Stage)以及各阶段的智能体定义。用户可通过 /workflows 命令开启可视化监控界面。以下是一个完整的工作流脚本示例——deep-research 深度研究(官方内置):
有必要厘清 Workflow 与现有的 Skills、Sub-agent 及 Agent Teams 之间的关系:Skills 旨在解决“能力封装”,Sub-agent 侧重“临时委派”,Agent Teams 处理“多角色并行”,而 Workflow 则致力于“流程固化”——将编排逻辑编写为代码,使多智能体协作具备可复现性、可追踪性及可验证性。简言之:Skills 封装能力,Workflow 封装流程。
同类工具横向对比
需依赖 Claude Code v2.1.154 及以上版本,适用于 Max/Team/Enterprise 订阅计划。社区技能扩展:ray-amjad/claude-code-workflow-creator
📦 Claude Code v2.1.154+·研究预览版·官方文档:code.claude.com/docs/en/workflows
AgentKit — 如同 create-vite 般脚手架化多智能体工作流
多数开发者使用 Claude Code 的方式仍停留在单次长对话:描述需求、由 Claude 编写代码、纠错、再提示。AgentKit 旨在解决这一痛点:将 Claude Code 从“聊天式的一对一代码助手”进化为“可编排的多智能体工程流水线”。
其核心思路极为简洁。AgentKit 本身不包含任何 AI 模型——它是一个结构生成工具,能在项目中脚手架出一套编排文件:CLAUDE.md、PLAYBOOK.md、AGENT_WORKFLOW.md。工作流划分为三个阶段:Phase 0 分解(Claude Code 读取蓝图,提出智能体拆分方案)→ 技能注入暂停(向每个智能体目录投放 API 文档与数据)→ Phase 1 执行(各智能体按序运行,失败自动重试三次)。
作者利用 AgentKit 自举构建了一个真实项目——DevLog Desktop,这是一款基于 Tauri v2 结合 Ollama 本地 RAG 的桌面应用。成果显著:6 个智能体自主执行,通过 68 项测试,实现了完整的中英文国际化支持、暗色模式及语义搜索功能。整个过程均在一次 Claude Code 会话中完成。
⭐ 1·v1.0.0·MIT 协议·github.com/patricksardinha/agentkit-cli
Mirage — 为 AI 智能体构建统一的虚拟文件系统
AI 智能体面临一个根本性的碎片化难题:访问 S3 存储桶中的日志、Google Drive 里的文档、Slack 频道内的消息、GitHub 仓库中的代码时,每种数据源都有其独立的 SDK 和认证机制。Mirage 通过构建统一的虚拟文件系统解决了这一问题:将所有数据源挂载至同一文件树下,智能体仅需使用 ls、cat、grep、cp 等最熟悉的 bash 命令即可操作一切。
该工具在五月初发布后的三周内便收获了 2.7k stars,其增速表明这是一个真实且尚未被满足的市场需求。
⭐ 2,703·v0.0.1·Apache 2.0 协议·github.com/strukto-ai/mirage
Pullfrog — 开源版 CodeRabbit,Zod 作者最新力作
过去一年,AI 代码审查赛道的增长有目共睹:CodeRabbit 定义了该品类,GitHub Copilot Code Review 上线后迅速普及。然而,这些工具要么是闭源托管的 SaaS 服务,要么绑定特定的模型供应商。Pullfrog 选择了第三条道路:完全开源,运行在您自己仓库的 GitHub Actions 中,支持模型自选(BYOK),确保代码与数据绝不流出您的 GitHub 环境。
Pullfrog 由 Colin McDonnell 创立——他是 Zod(TypeScript 生态中最流行的 schema 验证库,拥有 42,000+ stars)的作者。Pullfrog 是一个运行在 CI 中的智能体编排层:监听 GitHub webhook 事件,并按配置触发智能体执行。使用方法简便:安装 Pullfrog GitHub App → 在仓库中添加一个 workflow → 在 PR 或 issue 中@pullfrog 即可触发。
⭐ 400+·Beta 版·MIT 协议·github.com/pullfrog/pullfrog·pullfrog.com