标签

AI进化之路:先谈约束,再谈成长

发布时间:2026-06-01 05:36来源:微信阅读:5

回顾过去一年的发展,我们逐渐习惯将AI视为一个“答疑解惑”的工具。

提出疑问,它回应答案;布置任务,它完成代码编写、文章创作、表格制作。这个阶段的AI如同一位高效外包:响应迅速,成果丰硕,但缺乏真正的内在成长。

真正的深层问题在于:

若AI能超越任务执行,从结果中反思、调整工具、更新记忆、优化流程,是否能演化为自我进化的系统?

这个设想既引人入胜,又暗藏风险。

吸引人之处在于,持续学习的AI将从静态工具转变为长期伙伴。但同时带来挑战:谁能决定AI的改进边界?如何验证修改?若出错能否回退?

因此,我逐渐认识到AI进化的关键并非“能否自我增强”,而是:

能否在可控约束下实现能力提升。

近期发现一个极具启发性的方向:Autogenesis/AGP。它致力于将智能体的自我进化从抽象概念转化为可工程化治理的协议。

其核心包含两个关键抽象:

简而言之:

其重要性体现在哪里?

当前关于AI自我改进的讨论往往忽略关键环节。我们常说要让AI自我反思、调整提示词、配置工具、更新记忆、优化工作流程。

然而,缺乏资源治理机制,这些操作实际上存在巨大风险。

提示词是否属于资源?工具调用权限是否属于资源?记忆片段是否属于资源?评估器是否属于资源?AI的身份、角色、边界是否属于资源?

若这些都视为资源,则每项资源都需要:

缺乏这些机制,“自我进化”将成为空洞且不可控的口号。

人们想象中的“自我进化AI”是一个日益聪明、自主性增强的系统:自我发现问题、自我改进、主动扩展工具、灵活调整规则。

但真正可实施的Agent OS可能恰恰相反。

它不是让AI自由改造自己,而是将每一次修改转化为可追溯的治理行为:

若用更贴近agent工作流的表述:

这类似于软件工程中的CI/CD流程,但管理对象发生了变化。

过去我们管理的是代码:追踪修改者、验证测试结果、控制发布流程、确保问题可回滚。

未来我们将管理更复杂的认知资源:提示词、记忆、工具、代理角色、源策略、评估器、工作流,甚至人机协作边界。

这正是Autogenesis等工作的价值所在。它向我们揭示:

AI自我进化并非单一能力,而是一套系统性的资源治理协议。

只有明确“可修改对象”和“修改流程”,self-evolve才能从科幻概念转化为实际工程系统。

对NOUS OS而言,这个方向至关重要。

NOUS OS的目标不是打造更智能的对话AI,也不是构建无人监管的自动化系统。它更像一个认知COO操作系统:协助人类捕获、整理、质疑、验证、复盘和沉淀判断过程。

因此,我如此理解Autogenesis与NOUS OS的关系:

Autogenesis管理代理的自我进化;NOUS OS管理人机共同进化。

Autogenesis重点解答:代理如何在系统边界内安全地实现自我改进?

NOUS OS还需深入追问:这种改进是否增强了人类能力?

换言之,NOUS OS关注的不仅是:

还关注:

这正是我将NOUS OS核心循环定义为:

真正值得追求的不是“AI日益自动化”,而是“人机组合日益增强的判断力”。

为何我将Trading Brain置于NOUS OS首个验证领域?

投资领域残酷而真实。

你可以构建出色的论点、进行精美研究、引用大量新闻、财务报告、专家观点和社交媒体信号。但市场最终会提出一个简单的问题:

你的判断最终是否被结果验证?

这迫使系统不能仅停留在“分析写作”层面,必须构建更完整的闭环:

关键在于:Trading Brain的self-evolve并非“AI自动交易”。

它是一个仅审核、人类把关的学习系统。能将研究信号转化为验证计划、观察列表、论点更新、风险审查、噪音过滤、证伪机制或下一轮影子学习,但不能绕过人类直接执行资本操作。

这条边界至关重要。

在高风险领域,真正的智能并非“更大胆行动”,而是“懂得何时不应行动”。

越来越坚信,AI系统实现长期协作的关键不是全自动化,而是构建可解释的拒绝、等待、回滚和复盘机制。

成熟的self-evolving系统至少应能回答以下问题:

若无法回答这些问题,就不应称之为self-evolve。

最多只能称为spontaneous mutation:随机变异。

随机变异在现实中并不总是进化,往往只是系统性风险。

这也代表我对AI下一阶段的基本判断:

第一阶段,我们追求模型能力:更强的写作、视觉、推理和工具调用能力。

第二阶段,我们追求代理能力:更精准的任务分解、更高效的协作、更智能的记忆运用、更流畅的流程执行。

第三阶段,我们真正要追求人机系统能力:更精准的边界设定、更严谨的验证、更深入的复盘、更协同的成长。

此阶段,记忆不再仅是“存储更多信息”,而是识别值得信赖的内容、需要质疑的信息、应逐渐淡化的记忆、必须遗忘的数据。

工作流不再仅是“自动化更多步骤”,而是明确哪些环节必须暂停,等待人类决策。

评估器不再仅是“检验模型答案对错”,而是衡量系统是否增强了人类能力、提升了责任感、降低了被幻觉和噪音误导的风险。

这正是NOUS OS探索的方向。

不是让AI替代人类判断,而是构建更强大、更可信、更具反思性的认知组合。

未来AI必将日益精进学习能力,持续完善自身。

但核心问题不在于“AI能否进化”,而是:

在谁的边界内进化?依据什么证据进化?出错能否回滚?人类是否因此变得更强大?

若答案是否定的,它不过是更复杂的自动化系统。

若答案是肯定的,它才可能成为真正的认知伙伴。

因此,AI在自我进化之前,需先学会被治理。

在人机共同进化之前,人类也需掌握一件事:

不是将判断权交给AI,而是与AI共同构建更清晰、更有据、更可追溯、更负责任的判断过程。

这或许是下一代Agent OS的真正方向。