代码进化为AI的"载体":深度解析未来五年"超级智能体"的运作机制
论文标题:《Code as Agent Harness: Toward Executable, Verifiable, and Stateful Agent Systems》(代码即智能体工作台:迈向可执行、可验证与有状态的智能体系统)
论文网址:https://arxiv.org/pdf/2605.18747
作者团队:由来自伊利诺伊大学厄巴纳-香槟分校(UIUC)、Meta(前Facebook)以及斯坦福大学的顶尖学者联合发表(核心贡献者包括Xuying Ning, Katherine Tieu等)。
发布时间:2026.05
核心关键词:Agent Harness(智能体工作台/底座)、Coding Agent(代码智能体)、Harness Engineering(工作台工程)、Agentic AI(智能体化AI)。
一句话摘要:代码不再仅仅是AI生成的"最终产品",而是变成了AI用来思考、行动、记忆和团队协作的"身体"、"工具"和"工作台"。
当前,像ChatGPT这类大语言模型(LLMs)在编程领域展现出强大能力,甚至能够协助维护整个软件项目。在此背景下,本论文提出了一个开创性的观点:在未来高度自主的AI智能体(Agent)系统中,代码不再只是一个"目标产出物"。代码正在演变为AI的"操作平台"——AI通过编写代码来推理复杂问题,通过执行代码来采取实际行动,把复杂的现实世界转化为代码环境,还能通过代码的错误反馈来验证自身的正确性。
本文将这一现象定义为"代码即智能体工作台(Code as Agent Harness)"。文章从三个维度深入剖析:首先,接口层(AI如何通过代码连接外部世界);其次,机制层(AI如何通过代码实现长期规划、记忆存储和工具调用);最后,扩展层(多个AI如何基于代码实现团队协作)。此外,文章还探讨了这类AI在编程助手、电脑界面自动化、实体机器人、科学研究等领域的应用前景及面临的挑战。
在深入探讨核心内容之前,我们先来了解一下当前的发展现状。
我们日常使用的ChatGPT,更像是一个被限制在封闭空间里的"超级大脑"。用户提出问题,它以自然语言(纯文字)形式进行回复。这种"纯文字"的思维模式存在三个关键缺陷:
无法实际执行:文字具有模糊性。AI声称"我帮你把文件删了",但实际上它只是"表达了"这个意图,并未真正采取行动。
无法有效验证:AI常常一本正经地胡说八道(产生幻觉)。在纯文字的环境中,用户很难立即验证其逻辑是否正确。
缺乏持续记忆(无状态):如果让AI完成一个持续一周的复杂任务,它在对话过程中会逐渐遗忘之前的内容。
研究人员意识到,要让AI从"聊天工具"进化为能够为人类工作的"数字员工(Agent)",中间必须存在一层关键组件。这个组件不仅能约束AI的行为,还能为AI提供工具支持、记忆存储和实时反馈。论文将此称为Harness(安全带/工作台/底座)。
而这篇论文的核心论点是:构建这个工作台最理想的材料,就是"代码"!
为何选择代码?因为代码具备三项独特属性:
可执行(Executable):代码是可以运行的。AI编写一段Python脚本来操控鼠标,这就转化为了真实的物理行动。
可审查(Inspectable):代码运行后会产生日志和错误信息(Bug)。AI可以通过分析错误输出,识别自身的问题所在,进而进行自我修正。
有状态(Stateful):代码和文档可以持久化存储在硬盘上。AI今天完成了部分工作,保存为代码文件,明天读取后能够无缝继续。
因此,这篇论文彻底颠覆了我们的认知:过去我们认为AI是"程序员",代码是其产出的"软件";而现在的真相是,AI是"灵魂",代码则是它的"躯体"及其所遵循的"运行法则"。
为了系统性地阐释"代码即工作台"理念,论文将这套系统分解为三个紧密关联的层次:接口层、机制层、扩展层。接下来我们逐一深入分析。
接口层阐述的是代码如何充当AI与现实世界沟通的"感官"和"肢体"。
以往,AI遇到数学问题时,会在内部用文字逐步推导(这称为思维链CoT),但最终往往在简单计算上出错。
现在,我们引导AI采用"程序化思考(PoT)"方式:AI仅需理清逻辑脉络,然后编写一段Python代码。让计算机中的Python解释器执行这段代码来得出最终答案。
通俗类比:过去AI依赖心算,如今AI拥有了超级计算器。这不仅显著降低了错误率,还能通过代码执行的反馈机制,让AI验证自身思路的准确性。
若想让AI控制机械臂抓取杯子,或让AI操作电脑为用户点外卖,该如何实现?
AI无法直接拥有肢体,其解决方案是生成一串"代码策略(Policy)"。例如,生成一段包含条件判断的Python代码:if 看到杯子: 机械臂.移动(坐标) else: 机械臂.寻找()。
通俗类比:代码就是AI操控物理世界和数字世界的"操控杆"。无论是机器人还是浏览器,只要提供了代码API接口,AI就能如同人类操作机器般实现精准控制。
当AI处理复杂任务时,它如何感知当前状态?论文指出,环境本身也可以被编码为代码形式。例如,将电脑屏幕上的网页转换为HTML代码结构树输入给AI;或在科学实验中,将实验流程编写为模拟器代码。
通俗类比:这就像电影《黑客帝国》中的"母体(Matrix)"。现实世界过于复杂AI难以理解,因此将世界转化为一行行"绿色跳动的代码",AI只需读取代码,就能准确了解世界的运行状态。
若仅停留在简单的一问一答模式,那仍然只是基础机器。要实现AI能够独立工作数天甚至更长时间且不出差错,就需要机制层的精心设计。
当面对"帮我开发一个贪吃蛇游戏"这类大型任务时,AI不能贸然行动。它必须首先制定计划。当代的AI不再只是口头描述,而是生成结构化的计划图(例如创建计划代码文件:Plan.md),其中明确规划了先编写哪个文件、再调用哪个接口。
而且如果中途遇到障碍,AI会动态修改这个计划代码。这就是规划能力的体现。
这是AI的"脑容量"管理机制。由于AI一次性能够处理的文本量有限(上下文窗口限制),当它在拥有数十万行代码的企业级代码库中工作时,它会采取什么策略?
工作记忆(短期):将当前报错信息、刚刚修改过的代码片段保留在当前视野中。
语义记忆(中期):在整个代码库中进行搜索查询,"之前有人写的那个登录接口在哪里?哦,找到了,提取出来给我查看"。
经验记忆(长期):将以往踩过的坑、解决过的问题整理成"经验代码"进行存储,下次遇到类似情况时直接复用。
通俗类比:这就像资深程序员桌上的便签纸(工作记忆)、电脑中的本地搜索工具(语义记忆)以及积累多年的代码库(经验记忆)。
AI在这个工作台中并非赤手空拳,它配备了"瑞士军刀"般的工具集。AI可以通过代码调用各类工具:例如查询维基百科、使用计算器、运行安全软件、甚至调用其他小型模型协助完成任务。
当前的研究趋势是对工具的使用权限进行严格管控,在"沙盒(Sandbox)"环境中执行。AI若要使用工具,必须经过工作台的授权审批,确保不会对系统造成破坏。
这是AI自我进化的核心引擎。
Plan(规划):AI首先构思修改方案。
Execute(执行):AI编写代码,并在安全的沙盒环境中运行测试。
Verify(验证):这是最关键的环节!工作台通过编译器、测试用例(Test cases)检验AI编写的代码是否正常运行。若报错,将错误信息(红色的一堆英文字母)反馈给AI,AI分析后说:"原来我少引入了一个包",然后重新修改完善。
通俗类比:这就像AI不仅能独立完成作业,还能自己当老师批改作业,哪里出现错误就打回重做,直到完全正确为止。
工作台还能通过收集AI日常操作日志(例如AI频繁在某个接口处报错),自动优化安全规则或提示词,使工作台愈发好用。这正是"用AI来优化AI的工作环境"。
单个AI能力有限,那么能否组建多个AI团队来"创业"?这就涉及到多智能体协作(Multi-Agent Systems, MAS)领域。
在这篇论文的视角中,多个AI之间最高效的协作方式并非"对话聊天",而是"共享代码状态"。
在这个数字团队中,通常包括:
规划师(Planner):负责将大型需求分解为若干小型任务。
程序员(Coder):专职负责代码编写。
测试员(Tester):负责编写测试脚本对程序员进行"刁难"。
审查员(Reviewer):如同经理角色,审核程序员编写的代码是否符合规范。
他们如何高效协作呢?
如果仅靠你一言我一语的聊天方式,很快就会产生理解偏差。因此论文指出,他们必须围绕"共享代码库(Shared Harness Substrate)"开展工作。
批评与修复(Critique and repair):程序员完成代码编写后提交,测试员运行发现Bug,将Bug报告反馈给程序员,程序员重新编写。
对抗性验证(Adversarial validation):专门设置一个"黑客AI",不断尝试攻击程序员AI编写的代码,从而提升代码的安全性。
辩论(Debate):遇到代码规范争议时,几个AI互相阐述理由,最终综合出一个最优解决方案。
这些AI团队可以采用不同的协作架构:
流水线(瀑布流模式):A完成后交给B,B测试完成后交给C(如著名的ChatDev框架)。
循环(敏捷开发模式):A完成后交给B测试,B发现Bug后打回给A,不断循环直到没有Bug。
星型/树状架构:一个CEO AI向底层的10个员工AI同时分配任务并行编写代码,完成后再进行整合。
通俗类比:这完全就是一个不知疲倦的软件外包公司。而它们之间所有的工作交接,全都是通过"可运行的代码和测试日志"来完成的,这确保了它们的工作脚踏实地、不会偏离轨道。
这篇论文不仅进行了理论探讨,还总结了"代码工作台"目前正在深刻变革的五大真实应用场景:
这已不再是过去那种仅帮你补全一行代码的工具(如早期的Copilot),而是像Devin、SWE-agent、Claude Code这样的自主软件工程师。
你可以直接将GitHub开源项目中的Bug丢给它说:"兄弟,帮我把这个Bug修复了"。它会自主拉取代码、阅读文档、自己尝试修改、自己在后台运行测试、测试通过后自动提交合并请求(PR)。这已经能够在真实的企业开发环境中发挥作用了。
设想一下,你对电脑说:"帮我上网购买一张明天下午去北京的高铁票,选择最便宜的"。
AI会将电脑屏幕上的按钮、窗口转化为它能够理解的"代码树(DOM树或无障碍接口树)",然后生成操作代码,控制鼠标和键盘打开浏览器、输入文字、点击购买。最近Anthropic发布的"Claude Computer Use(计算机控制)"就是这一概念的完美实践。
在现实世界中,机器人动作错误可能会损坏物品。通过代码工作台,大模型可以将"帮我倒杯水"的指令,转化为具有严格边界限制的控制代码(例如限制机械臂的最大力度)。更厉害的是,机器人在试错过程中学会的动作,可以编写为"技能代码库"进行存储。下一次它不仅能拿水杯,还能运用同样的技能去拿苹果。
这也是极其令人震撼的应用!AI科学家(如AI Scientist)可以通过代码,将提出假设、设计实验、进行实验、数据分析甚至撰写论文的整个流程全部自动化!
例如在化学领域,AI提出一种新材料配方,然后编写控制脚本,通过网络发送给真实的"自动化无人实验室(机器手臂混合化学试剂)",实验室将结果传回,AI分析数据后再调整配方。科学实验变成了一行行可执行、可重现的代码!
未来的推荐系统不再是神秘的算法黑盒子。AI可以把你(用户)的喜好,编写为清晰的结构化代码日志(例如:用户不喜欢看长视频)。你可以随时查看、修改这些"记忆代码",AI也会通过这种可视化的工作台为你提供完全贴心、且受你掌控的服务。
尽管"代码即工作台"描绘的未来令人振奋,但作者也极其客观地指出了目前存在的几项重大挑战(这部分对从业者极具启发价值):
让我们来做个总结。
在过去的几年里,我们惊叹于大语言模型(LLM)能够写出优美的文章和诗歌。但在严肃的商业、科学和工程领域,纯粹的"文字聊天"充满幻觉,是靠不住的。
《Code as Agent Harness》这篇论文高屋建瓴地指出了一条通往"可靠、自主通用人工智能(AGI)"的必由之路:将代码确立为智能体系统的基础设施。
对AI而言,代码是它的手和眼,让它的思考变得严谨(可验证),让它的动作落到实处(可执行),让它的记忆不再消散(有状态)。
对人类而言,代码构成了我们控制、约束和审查AI的安全绳(工作台)。我们通过为AI提供沙盒、测试工具、权限网关,确保这个强大的"数字员工"在一个安全、可控的环境中为我们服务。
未来的AI不再仅仅是与你聊天的"赛博幽灵",而是穿着代码机甲、拿着工具箱、熟练使用各种软件和机械设备的超级自动化操作员。
正如这篇论文所指出的,智能体的未来,是一场关于"工作台工程(Harness Engineering)"的科学。理解了这个道理,你就掌握了未来5年AI应用爆发的最核心逻辑!