AI概念场｜循环工程：超越提示词，构建AI的自运转机制

发布时间：2026-06-19 15:28阅读：30

本期概念

“Loop Engineering”

从写提示词，转向设计能自己提示、执行、验证和停止的 AI 工作循环

QincAI

沁菜

想象你招了个手脚勤快但业务生疏的新人：起初你事无巨细地布置任务（此即提示词工程），随后你发现更高效的做法是制定一套规范、验收标准、操作边界，让他自行试错、自我校验，直至活计达标。

将单次对话，演进为可控的闭环系统

循环工程，英文称 Loop Engineering。它并非某项具体产品，亦非某种模型功能，而是一种规划可调用工具的 AI 助手（agent）工作流的方法论。

这一理念近期由 Addy Osmani 系统性地推向公众视野：关键不在于人类持续手动输入指令，而是搭建一套机制，让机制去驱动 AI 助手、赋予其工具、回收执行结果、实施校验，继而判定是否迭代下一周期。OpenAI 在 Codex CLI 的技术阐释中亦呈现了底层 AI 工作循环（agent loop），即助手反复发起工具请求并反馈结果的运作过程：模型申请调用工具，外部程序执行该工具，将结果回注上下文，直至模型发出终止指令。更上一层，则是 AI 助手作业环境设计（harness engineering）：人类规划环境、限制条件、反馈机制与验证规则，使 AI 助手运行于更稳健的轨道之中。

可借助三层结构理解：提示词乃单条指令；AI 助手作业环境（agent harness）是一次任务场景，涵盖文件、工具、权限、上下文与约束条件；循环则是将任务反复交付 AI 助手，并以检验条件判定继续、重试、转人工或终止的系统。

其与提示词工程的分野在于，提示词工程优化的是"这次如何表达"；循环工程优化的是"若此次未竟，系统怎样察觉、怎样纠偏、怎样规避无限循环"。它与常规的 AI 多步作业流程（agentic workflow）亦有差异。多步流程或许仅是 A 至 B 再至 C 的线性推进，循环则凸显观测结果后的再度介入：执行、反馈、验证、再执行，直至条件满足或触发终止机制。

核心单元非单条提示词，而是可复用的任务循环。循环须具备输入、执行、观测、验证、决策与终止六大环节。适宜循环化的任务，通常具备成本低廉、目标清晰、完成状态可被机器核验的特征。

AI 从辅助角色，转为需管控的执行体系

循环工程骤然升温，并非源于新词创造，而是工具生态切实发生了变革。

Claude Code 搭载 /loop 与定时任务特性，可重复运行指令、轮询状态或排期一次性任务；Codex CLI 将 AI 工作循环（agent loop）向开发者透明呈现；Cursor、Claude Code、Codex 等工具陆续支持自动触发的轻量规则（hooks）、技能（skills）、子任务助手（sub-agents）、隔离的代码作业区（worktrees）、供 AI 对接外部工具的协议（MCP）等能力。AI 不再局限于聊天窗口中的建议提供者，而是能够介入项目环境、调度工具、修改文件、执行检查的实干者。

一旦 AI 具备执行能力，议题便随之转变。往昔忧虑的是"提示词撰写是否精准"；如今还需顾虑"是否会无限运行""是否会误改内容""是否会为通过测试而编写非常规补丁""本轮消耗了多少模型调用成本（token，按文字量计费单位）与外部 API 开支""何时必须人工干预"。循环工程的价值，正在于将这些风险充分暴露。

Blake Crosley 对此类实践有一番精辟论断：验证成本低廉之处，循环最易见效。例如测试是否通过、JSON 字段是否齐全、文档是否缺失标题、代码持续集成（CI）是否报错、网页状态码是否异常，皆可低成本核查。反之，若任务成败依赖人类审美、产品决策或复杂商业语境，循环则易放大谬误。

故而，循环工程并非"让 AI 全自动代劳"的幻术，而是"将可自动验证的部分交付 AI 迭代处理，将难以自动验证的部分保留给人类裁决"。这也是其对普通用户的价值所在：无需先掌握复杂编程，亦可运用循环思维改造低风险、重复性强、可核查的工作。

典型应用场景一：代码自动测试修复。失败的测试即为明确反馈，循环可尝试修复、运行测试、再修复，触及次数上限即停止。典型应用场景二：代码合并请求（PR）监护。自动追踪评论、冲突、检查结果，可处理的小问题交由 AI，涉及产品取舍时提醒人工。典型应用场景三：资料整理。定时读取新增文本，生成摘要，核查标题、

← 上一篇：边缘AI与国产解决方案下一篇：AI午报:智谱估值破8500亿、字节豪掷10亿美金购OpenAI、支付宝试水AI版 →