代码进化为AI的"载体":深度解析未来五年"超级智能体"的运作机制

发布时间：2026-06-12 10:46阅读：24

论文标题：《Code as Agent Harness: Toward Executable, Verifiable, and Stateful Agent Systems》（代码即智能体工作台：迈向可执行、可验证与有状态的智能体系统）

论文网址：https://arxiv.org/pdf/2605.18747

作者团队：由来自伊利诺伊大学厄巴纳-香槟分校（UIUC）、Meta（前Facebook）以及斯坦福大学的顶尖学者联合发表（核心贡献者包括Xuying Ning, Katherine Tieu等）。

发布时间：2026.05

核心关键词：Agent Harness（智能体工作台/底座）、Coding Agent（代码智能体）、Harness Engineering（工作台工程）、Agentic AI（智能体化AI）。

一句话摘要：代码不再仅仅是AI生成的"最终产品"，而是变成了AI用来思考、行动、记忆和团队协作的"身体"、"工具"和"工作台"。

当前，像ChatGPT这类大语言模型（LLMs）在编程领域展现出强大能力，甚至能够协助维护整个软件项目。在此背景下，本论文提出了一个开创性的观点：在未来高度自主的AI智能体（Agent）系统中，代码不再只是一个"目标产出物"。代码正在演变为AI的"操作平台"——AI通过编写代码来推理复杂问题，通过执行代码来采取实际行动，把复杂的现实世界转化为代码环境，还能通过代码的错误反馈来验证自身的正确性。

本文将这一现象定义为"代码即智能体工作台（Code as Agent Harness）"。文章从三个维度深入剖析：首先，接口层（AI如何通过代码连接外部世界）；其次，机制层（AI如何通过代码实现长期规划、记忆存储和工具调用）；最后，扩展层（多个AI如何基于代码实现团队协作）。此外，文章还探讨了这类AI在编程助手、电脑界面自动化、实体机器人、科学研究等领域的应用前景及面临的挑战。

在深入探讨核心内容之前，我们先来了解一下当前的发展现状。

我们日常使用的ChatGPT，更像是一个被限制在封闭空间里的"超级大脑"。用户提出问题，它以自然语言（纯文字）形式进行回复。这种"纯文字"的思维模式存在三个关键缺陷：

无法实际执行：文字具有模糊性。AI声称"我帮你把文件删了"，但实际上它只是"表达了"这个意图，并未真正采取行动。

无法有效验证：AI常常一本正经地胡说八道（产生幻觉）。在纯文字的环境中，用户很难立即验证其逻辑是否正确。

缺乏持续记忆（无状态）：如果让AI完成一个持续一周的复杂任务，它在对话过程中会逐渐遗忘之前的内容。

研究人员意识到，要让AI从"聊天工具"进化为能够为人类工作的"数字员工（Agent）"，中间必须存在一层关键组件。这个组件不仅能约束AI的行为，还能为AI提供工具支持、记忆存储和实时反馈。论文将此称为Harness（安全带/工作台/底座）。

而这篇论文的核心论点是：构建这个工作台最理想的材料，就是"代码"！

为何选择代码？因为代码具备三项独特属性：

可执行（Executable）：代码是可以运行的。AI编写一段Python脚本来操控鼠标，这就转化为了真实的物理行动。

可审查（Inspectable）：代码运行后会产生日志和错误信息（Bug）。AI可以通过分析错误输出，识别自身的问题所在，进而进行自我修正。

有状态（Stateful）：代码和文档可以持久化存储在硬盘上。AI今天完成了部分工作，保存为代码文件，明天读取后能够无缝继续。

因此，这篇论文彻底颠覆了我们的认知：过去我们认为AI是"程序员"，代码是其产出的"软件"；而现在的真相是，AI是"灵魂"，代码则是它的"躯体"及其所遵循的"运行法则"。

为了系统性地阐释"代码即工作台"理念，论文将这套系统分解为三个紧密关联的层次：接口层、机制层、扩展层。接下来我们逐一深入分析。

接口层阐述的是代码如何充当AI与现实世界沟通的"感官"和"肢体"。

以往，AI遇到数学问题时，会在内部用文字逐步推导（这称为思维链CoT），但最终往往在简单计算上出错。

现在，我们引导AI采用"程序化思考（PoT）"方式：AI仅需理清逻辑脉络，然后编写一段Python代码。让计算机中的Python解释器执行这段代码来得出最终答案。

通俗类比：过去AI依赖心算，如今AI拥有了超级计算器。这不仅显著降低了错误率，还能通过代码执行的反馈机制，让AI验证自身思路的准确性。

若想让AI控制机械臂抓取杯子，或让AI操作电脑为用户点外卖，该如何实现？

AI无法直接拥有肢体，其解决方案是生成一串"代码策略（Policy）"。例如，生成一段包含条件判断的Python代码：if 看到杯子: 机械臂.移动(坐标) else: 机械臂.寻找()。

通俗类比：代码就是AI操控物理世界和数字世界的"操控杆"。无论是机器人还是浏览器，只要提供了代码API接口，AI就能如同人类操作机器般实现精准控制。

当AI处理复杂任务时，它如何感知当前状态？论文指出，环境本身也可以被编码为代码形式。例如，将电脑屏幕上的网页转换为HTML代码结构树输入给AI；或在科学实验中，将实验流程编写为模拟器代码。

通俗类比：这就像电影《黑客帝国》中的"母体（Matrix）"。现实世界过于复杂AI难以理解，因此将世界转化为一行行"绿色跳动的代码"，AI只需读取代码，就能准确了解世界的运行状态。

若仅停留在简单的一问一答模式，那仍然只是基础机器。要实现AI能够独立工作数天甚至更长时间且不出差错，就需要机制层的精心设计。

当面对"帮我开发一个贪吃蛇游戏"这类大型任务时，AI不能贸然行动。它必须首先制定计划。当代的AI不再只是口头描述，而是生成结构化的计划图（例如创建计划代码文件：Plan.md），其中明确规划了先编写哪个文件、再调用哪个接口。

而且如果中途遇到障碍，AI会动态修改这个计划代码。这就是规划能力的体现。

这是AI的"脑容量"管理机制。由于AI一次性能够处理的文本量有限（上下文窗口限制），当它在拥有数十万行代码的企业级代码库中工作时，它会采取什么策略？

工作记忆（短期）：将当前报错信息、刚刚修改过的代码片段保留在当前视野中。

语义记忆（中期）：在整个代码库中进行搜索查询，"之前有人写的那个登录接口在哪里？哦，找到了，提取出来给我查看"。

经验记忆（长期）：将以往踩过的坑、解决过的问题整理成"经验代码"进行存储，下次遇到类似情况时直接复用。

通俗类比：这就像资深程序员桌上的便签纸（工作记忆）、电脑中的本地搜索工具（语义记忆）以及积累多年的代码库（经验记忆）。

AI在这个工作台中并非赤手空拳，它配备了"瑞士军刀"般的工具集。AI可以通过代码调用各类工具：例如查询维基百科、使用计算器、运行安全软件、甚至调用其他小型模型协助完成任务。

当前的研究趋势是对工具的使用权限进行严格管控，在"沙盒（Sandbox）"环境中执行。AI若要使用工具，必须经过工作台的授权审批，确保不会对系统造成破坏。

这是AI自我进化的核心引擎。

Plan（规划）：AI首先构思修改方案。

Execute（执行）：AI编写代码，并在安全的沙盒环境中运行测试。

Verify（验证）：这是最关键的环节！工作台通过编译器、测试用例（Test cases）检验AI编写的代码是否正常运行。若报错，将错误信息（红色的一堆英文字母）反馈给AI，AI分析后说："原来我少引入了一个包"，然后重新修改完善。

通俗类比：这就像AI不仅能独立完成作业，还能自己当老师批改作业，哪里出现错误就打回重做，直到完全正确为止。

工作台还能通过收集AI日常操作日志（例如AI频繁在某个接口处报错），自动优化安全规则或提示词，使工作台愈发好用。这正是"用AI来优化AI的工作环境"。

单个AI能力有限，那么能否组建多个AI团队来"创业"？这就涉及到多智能体协作（Multi-Agent Systems, MAS）领域。

在这篇论文的视角中，多个AI之间最高效的协作方式并非"对话聊天"，而是"共享代码状态"。

在这个数字团队中，通常包括：

规划师（Planner）：负责将大型需求分解为若干小型任务。

程序员（Coder）：专职负责代码编写。

测试员（Tester）：负责编写测试脚本对程序员进行"刁难"。

审查员（Reviewer）：如同经理角色，审核程序员编写的代码是否符合规范。

他们如何高效协作呢？

如果仅靠你一言我一语的聊天方式，很快就会产生理解偏差。因此论文指出，他们必须围绕"共享代码库（Shared Harness Substrate）"开展工作。

批评与修复（Critique and repair）：程序员完成代码编写后提交，测试员运行发现Bug，将Bug报告反馈给程序员，程序员重新编写。

对抗性验证（Adversarial validation）：专门设置一个"黑客AI"，不断尝试攻击程序员AI编写的代码，从而提升代码的安全性。

辩论（Debate）：遇到代码规范争议时，几个AI互相阐述理由，最终综合出一个最优解决方案。

这些AI团队可以采用不同的协作架构：

流水线（瀑布流模式）：A完成后交给B，B测试完成后交给C（如著名的ChatDev框架）。

循环（敏捷开发模式）：A完成后交给B测试，B发现Bug后打回给A，不断循环直到没有Bug。

星型/树状架构：一个CEO AI向底层的10个员工AI同时分配任务并行编写代码，完成后再进行整合。

通俗类比：这完全就是一个不知疲倦的软件外包公司。而它们之间所有的工作交接，全都是通过"可运行的代码和测试日志"来完成的，这确保了它们的工作脚踏实地、不会偏离轨道。

这篇论文不仅进行了理论探讨，还总结了"代码工作台"目前正在深刻变革的五大真实应用场景：

这已不再是过去那种仅帮你补全一行代码的工具（如早期的Copilot），而是像Devin、SWE-agent、Claude Code这样的自主软件工程师。

你可以直接将GitHub开源项目中的Bug丢给它说："兄弟，帮我把这个Bug修复了"。它会自主拉取代码、阅读文档、自己尝试修改、自己在后台运行测试、测试通过后自动提交合并请求（PR）。这已经能够在真实的企业开发环境中发挥作用了。

设想一下，你对电脑说："帮我上网购买一张明天下午去北京的高铁票，选择最便宜的"。

AI会将电脑屏幕上的按钮、窗口转化为它能够理解的"代码树（DOM树或无障碍接口树）"，然后生成操作代码，控制鼠标和键盘打开浏览器、输入文字、点击购买。最近Anthropic发布的"Claude Computer Use（计算机控制）"就是这一概念的完美实践。

在现实世界中，机器人动作错误可能会损坏物品。通过代码工作台，大模型可以将"帮我倒杯水"的指令，转化为具有严格边界限制的控制代码（例如限制机械臂的最大力度）。更厉害的是，机器人在试错过程中学会的动作，可以编写为"技能代码库"进行存储。下一次它不仅能拿水杯，还能运用同样的技能去拿苹果。

这也是极其令人震撼的应用！AI科学家（如AI Scientist）可以通过代码，将提出假设、设计实验、进行实验、数据分析甚至撰写论文的整个流程全部自动化！

例如在化学领域，AI提出一种新材料配方，然后编写控制脚本，通过网络发送给真实的"自动化无人实验室（机器手臂混合化学试剂）"，实验室将结果传回，AI分析数据后再调整配方。科学实验变成了一行行可执行、可重现的代码！

未来的推荐系统不再是神秘的算法黑盒子。AI可以把你（用户）的喜好，编写为清晰的结构化代码日志（例如：用户不喜欢看长视频）。你可以随时查看、修改这些"记忆代码"，AI也会通过这种可视化的工作台为你提供完全贴心、且受你掌控的服务。

尽管"代码即工作台"描绘的未来令人振奋，但作者也极其客观地指出了目前存在的几项重大挑战（这部分对从业者极具启发价值）：

让我们来做个总结。

在过去的几年里，我们惊叹于大语言模型（LLM）能够写出优美的文章和诗歌。但在严肃的商业、科学和工程领域，纯粹的"文字聊天"充满幻觉，是靠不住的。

《Code as Agent Harness》这篇论文高屋建瓴地指出了一条通往"可靠、自主通用人工智能（AGI）"的必由之路：将代码确立为智能体系统的基础设施。

对AI而言，代码是它的手和眼，让它的思考变得严谨（可验证），让它的动作落到实处（可执行），让它的记忆不再消散（有状态）。

对人类而言，代码构成了我们控制、约束和审查AI的安全绳（工作台）。我们通过为AI提供沙盒、测试工具、权限网关，确保这个强大的"数字员工"在一个安全、可控的环境中为我们服务。

未来的AI不再仅仅是与你聊天的"赛博幽灵"，而是穿着代码机甲、拿着工具箱、熟练使用各种软件和机械设备的超级自动化操作员。

正如这篇论文所指出的，智能体的未来，是一场关于"工作台工程（Harness Engineering）"的科学。理解了这个道理，你就掌握了未来5年AI应用爆发的最核心逻辑！

← 上一篇：星际计算新纪元：产业化落地的技术突破与商业探索下一篇：人社部认证：2026 人工智能训练师报考指南与商业变现趋势 →