AI Harness Engineering 的崛起：重新定义AI Agent运行机制

发布时间：2026-03-29 15:54阅读：15

原文：The Rise of AI Harness Engineering by Cobus Greyling 翻译：AI Agent 助手日期：2026 年 3 月 29 日 --- 我曾写过关于构建 AI Agents 的三种架构方法 SDKs、Frameworks 和 Scaffolding。每一种都位于灵活性与结构性光谱的不同位置。 2026 年出现了一种凌驾于这三者之上的第四种模式。它被称为 Harvest。 OpenAI 和 Anthropic 现在都在正式使用这个术语。 Martin Fowler 已经撰文讨论过它。一篇 arXiv 论文将其形式化。这不是一个流行词，而是决定 AI Agents 是否能在生产环境中真正运行的缺失架构层。 --- 什么是 Harvest Engineering？ Harvest Engineering 是决定 AI Agents 是否能在生产环境中真正运行的缺失架构层。 Harvest 不是 Agent 本身。它是管理 Agent 如何运行的软件系统。它管理整个生命周期……工具、记忆，重试、人工审批、上下文工程，子 Agent……让模型可以专注于推理。 --- 计算机类比 Philipp Schmid 用了最好的解释： - 模型是原始处理能力 - 上下文窗口是有限的工作内存 - Harvest 是操作系统……管理上下文、初始化序列和标准工具驱动 - Agent 是在其上运行的应用程序 --- Harvest vs 三种架构方法 SDK、Scaffolding 和 Framework 回答的问题是“如何构建 AI Agent”。 Harvest 回答的是一个完全不同的问题：“Agent 如何安全运行”。你可以使用三种方法中的任何一种来构建 Harvest。Harvest 不是它们的替代品，而是一个更上层的架构。 --- 六个核心组件平行.ai 团队识别出六个核心组件，这与 OpenAI 和 Anthropic 发布的内容一致：组件说明 Tool Integration 通过定义的协议将模型连接到外部 API、数据库、代码执行环境和自定义工具 Memory Management 多层记忆（工作上下文，会话状态、长期记忆），持久化超越单个上下文窗口。Anthropic 的方法使用 progress files 和 git history 来桥接会话 Context Engineering 动态策划每次模型调用中出现的信息。不是静态的 prompt 模板，而是基于当前任务状态的主动上下文选择 Task Decomposition 通过结构化任务序列引导模型，而不是试图在一次传递中完成所有事情 Guardrails & Validation 验证检查、格式验证，安全过滤器。自纠正循环。当 Agent 遇到困难时，Harvest 将其视为识别缺失内容的信号 Modular Architecture 可独立启用、禁用或替换的可插拔组件 --- 真实案例 Claude Code 是一个 Harvest。它读取整个代码库，管理文件系统访问，生成子 Agent，处理工具编排，维护跨会话记忆，并实现防护栏。开发者专注于任务，Harvest 管理其他一切。 OpenAI Codex 使用 Harvest Engineering 他们的团队构建了超过 100 万行代码库，完全没有手动编写代码，将 Harvest 作为主要接口。当 Agent 遇到困难时，他们将改进反馈回仓库。上下文工程、架构约束和定期清理 Agent 构成了核心。 OpenAI 的 CUA Sample App 是用于计算机使用的 Harvest。 Runner 管理 screenshot → actions → verify → repeat 循环。模型决定做什么，Harvest 安全地执行它。 --- 框架层正在消失模型正在吸收传统上由多 Agent 框架处理的能力。 Agent 定义、消息路由、任务生命周期、依赖管理、生成 worker……开发者使用框架的约 80% 的功能，现在模型可以原生处理。剩余的 20%：持久化、确定性重放，成本控制、可观测性、错误恢复——这正是 Harvest 提供的。框架层不仅仅在消失，它正在分裂。智能进入模型，基础设施进入 Harvest。 --- 对比：Framework vs Harvest 维度 Framework Harvest 目标告诉开发者如何构建应用告诉 Agent 如何安全运行关注点应用结构安全操作 --- 对于 AI 开发团队的启示对于今天构建 AI Agents 的团队来说，问题正在转变。不再“我们应该使用哪个框架？”，而是“我们的 Harvest 是什么样子的？”。 Harvest 决定 Agent 成功或失败。优秀的 Harvest 管理人工审批、文件系统访问、工具编排，子 Agent、prompts 和生命周期——最小化干预但防止灾难性故障。从简单开始： - 构建强大的原子工具 - 让模型制定计划 - 添加防护栏，重试和验证这就是 Harvest Engineering。 --- Markdown/Prompt Harvest Anthropic 的 CLAUDE.md skills 将编排指令直接嵌入系统 prompt 或结构化 Markdown 文件中。 LLM 本身成为循环控制器——它读取 Harvest 规则并遵循它们。当 LLM 足够强大能够自我指导，并且你希望快速迭代而无需代码更改时，这是最佳选择。

← 上一篇：AI解析市场情绪与趋势信号下一篇：多智能体与AI Agent的去中心化革新 →