标签

AI概念场|循环工程:超越提示词,构建AI的自运转机制

发布时间:2026-06-19 15:28阅读:1

本期概念

“Loop Engineering”

从写提示词,转向设计能自己提示、执行、验证和停止的 AI 工作循环

QincAI

沁菜

想象你招了个手脚勤快但业务生疏的新人:起初你事无巨细地布置任务(此即提示词工程),随后你发现更高效的做法是制定一套规范、验收标准、操作边界,让他自行试错、自我校验,直至活计达标。

将单次对话,演进为可控的闭环系统

循环工程,英文称 Loop Engineering。它并非某项具体产品,亦非某种模型功能,而是一种规划可调用工具的 AI 助手(agent)工作流的方法论。

这一理念近期由 Addy Osmani 系统性地推向公众视野:关键不在于人类持续手动输入指令,而是搭建一套机制,让机制去驱动 AI 助手、赋予其工具、回收执行结果、实施校验,继而判定是否迭代下一周期。OpenAI 在 Codex CLI 的技术阐释中亦呈现了底层 AI 工作循环(agent loop),即助手反复发起工具请求并反馈结果的运作过程:模型申请调用工具,外部程序执行该工具,将结果回注上下文,直至模型发出终止指令。更上一层,则是 AI 助手作业环境设计(harness engineering):人类规划环境、限制条件、反馈机制与验证规则,使 AI 助手运行于更稳健的轨道之中。

可借助三层结构理解:提示词乃单条指令;AI 助手作业环境(agent harness)是一次任务场景,涵盖文件、工具、权限、上下文与约束条件;循环则是将任务反复交付 AI 助手,并以检验条件判定继续、重试、转人工或终止的系统。

其与提示词工程的分野在于,提示词工程优化的是"这次如何表达";循环工程优化的是"若此次未竟,系统怎样察觉、怎样纠偏、怎样规避无限循环"。它与常规的 AI 多步作业流程(agentic workflow)亦有差异。多步流程或许仅是 A 至 B 再至 C 的线性推进,循环则凸显观测结果后的再度介入:执行、反馈、验证、再执行,直至条件满足或触发终止机制。

核心单元非单条提示词,而是可复用的任务循环。循环须具备输入、执行、观测、验证、决策与终止六大环节。适宜循环化的任务,通常具备成本低廉、目标清晰、完成状态可被机器核验的特征。

AI 从辅助角色,转为需管控的执行体系

循环工程骤然升温,并非源于新词创造,而是工具生态切实发生了变革。

Claude Code 搭载 /loop 与定时任务特性,可重复运行指令、轮询状态或排期一次性任务;Codex CLI 将 AI 工作循环(agent loop) 向开发者透明呈现;Cursor、Claude Code、Codex 等工具陆续支持自动触发的轻量规则(hooks)、技能(skills)、子任务助手(sub-agents)、隔离的代码作业区(worktrees)、供 AI 对接外部工具的协议(MCP)等能力。AI 不再局限于聊天窗口中的建议提供者,而是能够介入项目环境、调度工具、修改文件、执行检查的实干者。

一旦 AI 具备执行能力,议题便随之转变。往昔忧虑的是"提示词撰写是否精准";如今还需顾虑"是否会无限运行""是否会误改内容""是否会为通过测试而编写非常规补丁""本轮消耗了多少模型调用成本(token,按文字量计费单位)与外部 API 开支""何时必须人工干预"。循环工程的价值,正在于将这些风险充分暴露。

Blake Crosley 对此类实践有一番精辟论断:验证成本低廉之处,循环最易见效。例如测试是否通过、JSON 字段是否齐全、文档是否缺失标题、代码持续集成(CI)是否报错、网页状态码是否异常,皆可低成本核查。反之,若任务成败依赖人类审美、产品决策或复杂商业语境,循环则易放大谬误。

故而,循环工程并非"让 AI 全自动代劳"的幻术,而是"将可自动验证的部分交付 AI 迭代处理,将难以自动验证的部分保留给人类裁决"。这也是其对普通用户的价值所在:无需先掌握复杂编程,亦可运用循环思维改造低风险、重复性强、可核查的工作。

典型应用场景一:代码自动测试修复。失败的测试即为明确反馈,循环可尝试修复、运行测试、再修复,触及次数上限即停止。典型应用场景二:代码合并请求(PR)监护。自动追踪评论、冲突、检查结果,可处理的小问题交由 AI,涉及产品取舍时提醒人工。典型应用场景三:资料整理。定时读取新增文本,生成摘要,核查标题、