AI工程演进:从提示词到约束框架的四次关键变革
大家好,我是老秦。如果你对AI领域感兴趣,欢迎关注我的公众号「跟老秦唠AI」,我会不定期分享AI相关的知识。
你知道AI领域最让人不安的是什么吗?
并非AI技术本身的飞速发展,而是——
你刚掌握的技术,转眼间可能就落后了。
提示词工程(Prompt Engineering)的热度持续了大约一年。
上下文工程(Context Engineering)流行了半年左右。
技能(Skill)与智能体(Agent)的概念刚成为焦点。
如今,一个新术语又出现了:约束工程(Harness Engineering)。
Martin Fowler将其称为“AI赋能软件开发的核心架构”。
我花了一周时间深入研究,终于理清了这四次演进的内在逻辑。
今天这篇文章将为你完整梳理。
核心焦点:如何表达
在2022至2023年间,AI更多被视为一个“强大的文本交互接口”。
你向它提问,它给出回应。
但问题在于——提出相同的问题,使用不同的表述方式,得到的结果可能天壤之别。
因此,第一波热潮兴起:如何提问才能让AI给出更优质的答案?
这就是提示词工程(Prompt Engineering)。
其核心目标在于:优化输入的提示词,使模型在单次对话中能产生更一致、更稳定的输出。
如何提供少量示例(few-shot)?如何撰写系统提示(system prompt)?如何约束输出格式?
你逐渐学会了使用诸如“请逐步思考(think step by step)”这样的指令。
学会了设定角色:“你是一位专业的XXX”。
学会了要求结构化输出:“请以JSON格式输出”。
这个阶段的关键在于:如何表达。
核心焦点:提供何种信息
提示词变得越来越冗长,但其效果却遇到了瓶颈。
因为AI并非万能,它存在“遗忘”问题——当上下文过长时,它的回答就可能变得不准确。
于是人们开始思考:能否只提供给AI最核心、最关键的信息?
由此催生了第二波热潮:上下文工程(Context Engineering)。
其核心同样是解决一个问题:如何为AI提供充足但不过量的背景信息。
你开始学习并应用RAG(检索增强生成)。
开始接触向量数据库。
学会了如何将知识“喂”给AI,而不是期望它“记住”所有内容。
这个阶段的关键在于:提供何种信息。
核心焦点:具备何种能力
单一任务的处理解决了,但现实世界的任务往往是多步骤、复合型的。
AI需要能够调用工具、读写文件、操作浏览器、访问API……
于是,第三波热潮随之而来:智能体(Agent)与技能(Skill)。
其核心是:赋予AI“手”和“脚”,使其能够执行真实世界的任务。
模型上下文协议(MCP, Model Context Protocol)逐渐成为标准配置。
各种技能市场应运而生。
你开始向AI发出这样的指令:“请将这个需求编写成代码并部署到服务器上”。
AI不再仅仅是回答问题,它开始真正“工作”——编写代码、运行测试、部署上线。
这个阶段的关键在于:具备何种能力。
核心焦点:如何确保持续正确执行
然而——
随着AI自主性越来越强,一个更严峻的问题浮现出来:
行业此时才意识到:让AI执行任务并非最困难的,最难的是让它“持续、稳定、可靠”地工作。
因此,第四波热潮兴起:约束工程(Harness Engineering)。
“Harness”一词的本意是“马具”或“安全带”。
其核心理念是:为AI智能体构建一套完整的安全可靠运行环境,从系统架构层面约束模型行为、管理资源权限、保障执行的可靠性。
它关注的焦点不再是“如何将模型训练得更强大”,而是“如何设计模型运行的整体框架”。
这四次演进并非简单的替代关系,而是一种嵌套叠加的关系。
打个比方:
你不会让一位新员工在没有防护措施的环境下直接操作重型机械。
同样,你也需要为AI搭建“防护栏”。
以Anthropic的实践为例:
他们推出了多智能体约束框架(Multi-Agent Harness),采用三智能体拓扑结构来解决长周期任务问题:
AI生成代码后,自行验证、自行纠错、自行迭代。
不再是“一次性生成,交由人类检查”。
而是“持续执行,持续验证”。
约束框架的核心组件:
坦率地说:目前大多数人仍停留在提示词工程阶段。
但了解发展趋势至关重要。
就像在2010年,你不必精通移动互联网,但需要知道它正在改变世界。
我的判断是:
你现在可以着手做的是:
如果觉得这些内容对你有帮助——
欢迎关注公众号「跟老秦唠AI」,我将持续更新更多AI工具的使用方法和最新动态。