标签

OpenAI 34 页 Agent 开发手册核心就五个字:while 循环

发布时间:2026-06-30 06:20阅读:1

到了 2026 年,"Agent"可能是 AI 圈子里被滥用得最严重的词汇。

每过三天就有新框架吹嘘自己解锁了"真正的 Agent 实力",每过一周就有人在推特上晒出比航天飞机还复杂的多 Agent 架构图。创业者在融资演示里塞满了 Agent 字眼,投资人的谈论也全是 Agent。

但要是你拉住随便一个人问:"Agent 究竟是什么意思?"——十有八九你会得到一段含混不清、堆满术语、实质上一无所获的答复。

直到 OpenAI 亲自出手,发布了一份 34 页的实战手册。

翻阅完整份 PDF,X 上有个开发者 @shmidtqq 写了一条总结帖,把 34 页浓缩成了一个论断:

"The key insight: the agent is not the model, it is the loop around it. The same model in one call is a chatbot. The same model in a loop, with tools and an exit condition, is an agent."

「核心洞见:Agent 的根本是环绕模型的那个循环。同一个模型调用一次就是对话机器人;放进循环里,搭配工具和退出条件,就成了 Agent。」

这条帖子获得了 172 个赞、1.6 万次浏览——在技术圈里,这算得上是刷屏级。

▲ @shmidtqq 把 34 页手册浓缩为"Agent is a loop",1.6 万浏览

这份手册名为A Practical Guide to Building Agents,挂在 OpenAI Business 页面上,面向产品和工程团队。

翻开目录,结构极其清晰:

没有冗余,没有营销包装。34 页全是从真实客户部署中提炼出的实践心得。

▲ OpenAI 官网手册落地页,目录结构一目了然

先看 OpenAI 如何界定 Agent:

"Agents are systems that independently accomplish tasks on your behalf."

「Agent 是能代表你独立完成任务的系统。」

留意"独立"这两个字。你给 ChatGPT 发送一条消息,它回复你一条——这是对话。你给一个系统目标、工具和规则指南,它自行决定查阅什么资料、调用什么 API、撰写什么草稿,遇到错误自行重试,最后达到你定义的"完成标准"——这才是 Agent。

手册特意划了一条界限:集成了 LLM 但没有将工作流执行的控制权交给 LLM 的应用——简单聊天机器人、单轮 API 调用、情感分类器——统统不算 Agent。

OpenAI 把 Agent 的基础拆成三个组件:

01 Model——LLM 本身,负责推理和决策。选什么模型取决于任务复杂度和延迟需求。

02 Tools——模型能调用的外部函数和 API。这是 Agent 伸向真实世界的触角。手册把工具分成三种:

03 Instructions——明确的行为指引,告诉 Agent 怎么做、什么能做、什么不能做。

用代码写出来就是这样:

看上去简单得离谱。但这段代码本身只是一个静态定义——接下来的部分,才是让它活过来的关键。

这是整份手册最核心的一段话:

"Every orchestration approach needs the concept of a 'run', typically implemented as aloopthat lets agents operate until an exit condition is reached."

「每种编排方式都需要一个'运行'的概念,通常实现为一个循环,让 Agent 持续操作直到满足退出条件。」

紧接着,手册直接指出:

"This concept of a while loop is central to the functioning of an agent."

「while loop 这个概念是 Agent 运行的核心。」

白纸黑字,OpenAI 亲手写的。

翻译成人话就是:模型运行 → 决定调用哪个工具 → 拿到工具结果 → 把结果喂回去 → 模型再运行 → 再决定 → 再调用……如此循环,直到触发退出条件。

用伪代码表示这个过程:

就这么几行。这就是 Agent 的全部架构骨架。

OpenAI Agents SDK 里的Runner.run()方法,封装的正是这个 while 循环。SDK 文档说得很清楚:想自己控制循环,用 Responses API;想让框架帮你管循环、工具、护栏和状态传递,就用 Agent + Runner。

▲ OpenAI Agents SDK 文档,清晰展示 Runner 内部的 loop 运行机制

退出条件只有两种:

没有第三种。

@shmidtqq 在帖子里专门强调了这一点:

"The exit condition is the design: the loop stops on a clear rule. You define when it stops, not 'until it is done'."

「退出条件是设计决策:循环在明确规则下停止。停止时刻由你定义,不能交给一句'直到做完'。」

这绝对是实在话。

"直到做完"听起来很合理,但在实际部署中,它恰恰是成本失控的起点。社区里有人分享过真实案例:一个没有设好退出条件的 Agent 运行了11 天,烧掉了4.7 万美元。模型在循环里不断调用工具、不断拿到新数据、不断决定"还没完"——然后账单就这么滚上去了。

反过来,设计好退出条件和工具边界的 Agent loop,能让一个人在一个月内产出259 个 Pull Request——这也是真实的生产数据。

同一个 while 循环,有刹车和没刹车,天差地别。

手册里有一个建议,可能会让很多"多 Agent 架构师"不太舒服:

先别急着搞 swarm。

OpenAI 强烈建议先把单个 Agent 加工具的能力做到极致。只有当你的 prompt 里出现大量 if-then-else 分支、工具数量太多且功能重叠的时候,再考虑拆分成多个 Agent。

手册给了两种多 Agent 模式:

Manager 模式——一个中央 Manager Agent 把子 Agent 当工具调用,保持单一控制点。比如一个翻译 Manager 调用西班牙语、法语、意大利语三个子 Agent。

Handoff 模式——对等的 Agent 之间互相交接控制权。比如一个分诊 Agent 根据问题类型把用户交给技术支持、销售或订单处理 Agent。

但两种模式的前提都是:你已经证明单 Agent 搞不定了。

很多团队一上来就搞四五个 Agent 互相喊话,结果调试时发现状态传递一团乱麻。先把一个 loop 跑顺,比搭建任何花哨的 Agent 网络都重要。

一个裸奔的 while 循环在生产环境里只有一个结局:出事。

所以手册用了整整 8 页讲 Guardrails(护栏),把防御做成多层结构:

LLM 层——用分类器做护栏。包括相关性分类器(防止 Agent 跑题)、安全分类器(拦截 jailbreak 和 PII 泄漏)、对话循环检测器(发现 Agent 在原地打转)。

规则层——黑名单、正则匹配、长度限制。简单粗暴但有效。

工具层——给每个工具标风险等级。只读操作标"低风险",可逆操作标"中风险",涉及财务或不可逆操作标"高风险"。高风险工具触发人工审批。

人机回环——这是最后一道防线。手册的原话:高风险动作必须有人类审批,直到系统置信度足够高。失败次数超过阈值时,Agent 必须把控制权交还人类。

SDK 的实现方式很聪明:主流程乐观执行,护栏并发检查。护栏没触发,用户无感知;护栏触发了,抛出异常,中断循环。兼顾体验和安全。

这份手册在多个渠道引发了大量讨论。

@AnatoliKopadze 做了一件更狠的事——把 34 页压缩成了1 页架构图。6 个阶段、1 个循环,从 Goal + Input → Model → Tools → Instructions → Guardrails → Evals,底层跑着 Traces + Logs + Feedback 持续改进层。这条帖子拿到了601 赞、7.5 万次浏览。

▲ @AnatoliKopadze 把 34 页压缩成 1 页,6 stages + 1 loop,601 赞

Reddit 的 r/AI_Agents 社区也在热议。有用户指出手册覆盖了架构、工具迭代循环和安全护栏三个关键层面,评价是"this type of docs are really helpful"。Indie Hackers 上有开发者做了详细的 breakdown,称赞其"really good"。

▲ Reddit 上开发者对手册的讨论

有一条评论特别精辟:

"The agent is not the model, it's the loop around it — is such a clean way to put it."

「Agent 的根本是环绕模型的那个循环——这表述太干净了。」

当然,也有清醒的声音。有评论指出这是给开发者在 OpenAI API 上构建 Agent 的实战手册,不要误读成"OpenAI 内部用的模型架构"。还有人对 exit condition 表达了直觉上的焦虑:"'Until it is done' is where agents get expensive and weird."——"直到做完",恰恰是 Agent 变贵和变诡异的起点。

回到那个最根本的问题:这 34 页到底改变了什么?

它把过去一年多笼罩在 Agent 概念上的迷雾一扫而光。

很多人以为"更好的 prompt = 更好的 Agent",以为给 GPT 写一段更长更精妙的系统提示词就能让它变成自主 Agent。OpenAI 用自己的生产经验告诉你:prompt 只是配置项,loop 才是架构。

同一个模型,一次调用就是聊天机器人。 同一个模型,放进一个设计过退出条件的循环,配上精选的工具和分层的护栏——就是能帮你干活的 Agent。

这份手册给出的起步建议也极其务实:

"Start small, validate with real users, and grow capabilities over time."

「从小处开始,用真实用户验证,随时间逐步扩展能力。」

计算机科学里最朴素的原语——一个 while 循环——被证明是 Agent 时代最核心的构建单元。34 页 PDF 的分量,全压在这几行代码上。

接下来的战场,属于懂得设计这个循环的人。