OpenAI 34 页 Agent 开发手册核心就五个字：while 循环

发布时间：2026-06-30 06:20阅读：1

到了 2026 年，"Agent"可能是 AI 圈子里被滥用得最严重的词汇。

每过三天就有新框架吹嘘自己解锁了"真正的 Agent 实力"，每过一周就有人在推特上晒出比航天飞机还复杂的多 Agent 架构图。创业者在融资演示里塞满了 Agent 字眼，投资人的谈论也全是 Agent。

但要是你拉住随便一个人问："Agent 究竟是什么意思？"——十有八九你会得到一段含混不清、堆满术语、实质上一无所获的答复。

直到 OpenAI 亲自出手，发布了一份 34 页的实战手册。

翻阅完整份 PDF，X 上有个开发者 @shmidtqq 写了一条总结帖，把 34 页浓缩成了一个论断：

"The key insight: the agent is not the model, it is the loop around it. The same model in one call is a chatbot. The same model in a loop, with tools and an exit condition, is an agent."

「核心洞见：Agent 的根本是环绕模型的那个循环。同一个模型调用一次就是对话机器人；放进循环里，搭配工具和退出条件，就成了 Agent。」

这条帖子获得了 172 个赞、1.6 万次浏览——在技术圈里，这算得上是刷屏级。

▲ @shmidtqq 把 34 页手册浓缩为"Agent is a loop"，1.6 万浏览

这份手册名为A Practical Guide to Building Agents，挂在 OpenAI Business 页面上，面向产品和工程团队。

翻开目录，结构极其清晰：

没有冗余，没有营销包装。34 页全是从真实客户部署中提炼出的实践心得。

▲ OpenAI 官网手册落地页，目录结构一目了然

先看 OpenAI 如何界定 Agent：

"Agents are systems that independently accomplish tasks on your behalf."

「Agent 是能代表你独立完成任务的系统。」

留意"独立"这两个字。你给 ChatGPT 发送一条消息，它回复你一条——这是对话。你给一个系统目标、工具和规则指南，它自行决定查阅什么资料、调用什么 API、撰写什么草稿，遇到错误自行重试，最后达到你定义的"完成标准"——这才是 Agent。

手册特意划了一条界限：集成了 LLM 但没有将工作流执行的控制权交给 LLM 的应用——简单聊天机器人、单轮 API 调用、情感分类器——统统不算 Agent。

OpenAI 把 Agent 的基础拆成三个组件：

01 Model——LLM 本身，负责推理和决策。选什么模型取决于任务复杂度和延迟需求。

02 Tools——模型能调用的外部函数和 API。这是 Agent 伸向真实世界的触角。手册把工具分成三种：

03 Instructions——明确的行为指引，告诉 Agent 怎么做、什么能做、什么不能做。

用代码写出来就是这样：

看上去简单得离谱。但这段代码本身只是一个静态定义——接下来的部分，才是让它活过来的关键。

这是整份手册最核心的一段话：

"Every orchestration approach needs the concept of a 'run', typically implemented as aloopthat lets agents operate until an exit condition is reached."

「每种编排方式都需要一个'运行'的概念，通常实现为一个循环，让 Agent 持续操作直到满足退出条件。」

紧接着，手册直接指出：

"This concept of a while loop is central to the functioning of an agent."

「while loop 这个概念是 Agent 运行的核心。」

白纸黑字，OpenAI 亲手写的。

翻译成人话就是：模型运行 → 决定调用哪个工具 → 拿到工具结果 → 把结果喂回去 → 模型再运行 → 再决定 → 再调用……如此循环，直到触发退出条件。

用伪代码表示这个过程：

就这么几行。这就是 Agent 的全部架构骨架。

OpenAI Agents SDK 里的Runner.run()方法，封装的正是这个 while 循环。SDK 文档说得很清楚：想自己控制循环，用 Responses API；想让框架帮你管循环、工具、护栏和状态传递，就用 Agent + Runner。

▲ OpenAI Agents SDK 文档，清晰展示 Runner 内部的 loop 运行机制

退出条件只有两种：

没有第三种。

@shmidtqq 在帖子里专门强调了这一点：

"The exit condition is the design: the loop stops on a clear rule. You define when it stops, not 'until it is done'."

「退出条件是设计决策：循环在明确规则下停止。停止时刻由你定义，不能交给一句'直到做完'。」

这绝对是实在话。

"直到做完"听起来很合理，但在实际部署中，它恰恰是成本失控的起点。社区里有人分享过真实案例：一个没有设好退出条件的 Agent 运行了11 天，烧掉了4.7 万美元。模型在循环里不断调用工具、不断拿到新数据、不断决定"还没完"——然后账单就这么滚上去了。

反过来，设计好退出条件和工具边界的 Agent loop，能让一个人在一个月内产出259 个 Pull Request——这也是真实的生产数据。

同一个 while 循环，有刹车和没刹车，天差地别。

手册里有一个建议，可能会让很多"多 Agent 架构师"不太舒服：

先别急着搞 swarm。

OpenAI 强烈建议先把单个 Agent 加工具的能力做到极致。只有当你的 prompt 里出现大量 if-then-else 分支、工具数量太多且功能重叠的时候，再考虑拆分成多个 Agent。

手册给了两种多 Agent 模式：

Manager 模式——一个中央 Manager Agent 把子 Agent 当工具调用，保持单一控制点。比如一个翻译 Manager 调用西班牙语、法语、意大利语三个子 Agent。

Handoff 模式——对等的 Agent 之间互相交接控制权。比如一个分诊 Agent 根据问题类型把用户交给技术支持、销售或订单处理 Agent。

但两种模式的前提都是：你已经证明单 Agent 搞不定了。

很多团队一上来就搞四五个 Agent 互相喊话，结果调试时发现状态传递一团乱麻。先把一个 loop 跑顺，比搭建任何花哨的 Agent 网络都重要。

一个裸奔的 while 循环在生产环境里只有一个结局：出事。

所以手册用了整整 8 页讲 Guardrails（护栏），把防御做成多层结构：

LLM 层——用分类器做护栏。包括相关性分类器（防止 Agent 跑题）、安全分类器（拦截 jailbreak 和 PII 泄漏）、对话循环检测器（发现 Agent 在原地打转）。

规则层——黑名单、正则匹配、长度限制。简单粗暴但有效。

工具层——给每个工具标风险等级。只读操作标"低风险"，可逆操作标"中风险"，涉及财务或不可逆操作标"高风险"。高风险工具触发人工审批。

人机回环——这是最后一道防线。手册的原话：高风险动作必须有人类审批，直到系统置信度足够高。失败次数超过阈值时，Agent 必须把控制权交还人类。

SDK 的实现方式很聪明：主流程乐观执行，护栏并发检查。护栏没触发，用户无感知；护栏触发了，抛出异常，中断循环。兼顾体验和安全。

这份手册在多个渠道引发了大量讨论。

@AnatoliKopadze 做了一件更狠的事——把 34 页压缩成了1 页架构图。6 个阶段、1 个循环，从 Goal + Input → Model → Tools → Instructions → Guardrails → Evals，底层跑着 Traces + Logs + Feedback 持续改进层。这条帖子拿到了601 赞、7.5 万次浏览。

▲ @AnatoliKopadze 把 34 页压缩成 1 页，6 stages + 1 loop，601 赞

Reddit 的 r/AI_Agents 社区也在热议。有用户指出手册覆盖了架构、工具迭代循环和安全护栏三个关键层面，评价是"this type of docs are really helpful"。Indie Hackers 上有开发者做了详细的 breakdown，称赞其"really good"。

▲ Reddit 上开发者对手册的讨论

有一条评论特别精辟：

"The agent is not the model, it's the loop around it — is such a clean way to put it."

「Agent 的根本是环绕模型的那个循环——这表述太干净了。」

当然，也有清醒的声音。有评论指出这是给开发者在 OpenAI API 上构建 Agent 的实战手册，不要误读成"OpenAI 内部用的模型架构"。还有人对 exit condition 表达了直觉上的焦虑："'Until it is done' is where agents get expensive and weird."——"直到做完"，恰恰是 Agent 变贵和变诡异的起点。

回到那个最根本的问题：这 34 页到底改变了什么？

它把过去一年多笼罩在 Agent 概念上的迷雾一扫而光。

很多人以为"更好的 prompt = 更好的 Agent"，以为给 GPT 写一段更长更精妙的系统提示词就能让它变成自主 Agent。OpenAI 用自己的生产经验告诉你：prompt 只是配置项，loop 才是架构。

同一个模型，一次调用就是聊天机器人。同一个模型，放进一个设计过退出条件的循环，配上精选的工具和分层的护栏——就是能帮你干活的 Agent。

这份手册给出的起步建议也极其务实：

"Start small, validate with real users, and grow capabilities over time."

「从小处开始，用真实用户验证，随时间逐步扩展能力。」

计算机科学里最朴素的原语——一个 while 循环——被证明是 Agent 时代最核心的构建单元。34 页 PDF 的分量，全压在这几行代码上。

接下来的战场，属于懂得设计这个循环的人。

← 上一篇：AI能写作，中文系还有价值吗？北大教师深度解析下一篇：人工智能赋能创造力的十条守则 →