控制论视角：AI自主决策的虚幻本质 | 机器智能与真实性危机（二）

发布时间：2026-06-16 08:17阅读：21

无论是Claude Code还是Codex，都支持一种操作：用户输入一个复杂的 /goal 指令，描述目标，然后关闭屏幕。系统会自动拆解任务，指挥子代理集群，规划步骤，应对中途的失败，尝试重试，更换路径，直到产出一份完整的交付报告。在此期间，人类并不在场。

这给人类留下了一个极其强烈的印象：这个系统正在自主地完成任务。

但“印象强烈”本身或许就是一种行动层面的“自主性错觉”，必须冷静剖析。首先，有两个必须厘清的问题——谁决定下一步做什么，以及谁定义什么算做完——这二者并非同一回事，而大多数关于“AI自主性”的讨论，往往将它们混淆了。

若把该场景的结构拆解来看：系统并非“输入、处理、输出”的单向流程。它实际上在进行持续的感知、比对与修正。运行一段代码，观察是否报错；将当前状态与参考状态对比，计算偏差；生成修正动作，再次执行，再次观察。这个循环不会在初次输出后终止，它会持续运转，直到误差收敛至可接受范围。

这种结构被称为反馈回路，在工程控制领域已应用了八十年。它并不神秘，也不独属于AI。恒温器感知室温，与设定值对比，触发制热或制冷，这是反馈回路。自动驾驶感知偏航，与目标轨迹比对，调整转向，这也是反馈回路。一个多代理的长任务系统，在结构上与恒温器属于同一类事物。区别仅在于感知对象的维度、误差函数的复杂度、动作空间的大小——而非结构类型本身。

这一区分的意义在于：复杂并不代表无法用结构解释，“像人”也不等同于“就是人”。

1948年，Norbert Wiener 出版了《控制论》，其副标题充满挑衅意味：关于在动物和机器中控制与通信的科学。核心论点简明扼要：目的性行为无需预设内在意志，任何装备了适当负反馈回路的系统，都能稳定地展现出“朝向目标、受阻时调整”的外在表现。

维纳并未宣称机器拥有了意志，恰恰相反——他将“意志”从目的性行为的必要前提中剥离了。控制论诞生后，你不能仅凭“该系统在追求目标”就断定它在“思考”或“理解”。

但控制论的精确性同时也界定了其边界。维纳的框架描述的是目的性行为的结构形式，对于回路中流动的信号承载何种语义内容，它保持沉默。在控制论框架内，恒温器的温度传感器和工程师阅读的错误日志，都是等价的误差信号——只要能驱动修正动作即可，信号是否被“理解”，控制论不予过问。

这种沉默在1948年是自觉的。维纳关注的是行为形式，是火炮和导弹的精确命中，而非符号或语言的意义问题。但在后来关于AI的大众叙事中，这一边界被系统性遗忘了。

此处需要引入一个在中文语境中颇为陌生、在英文主流正典中也未被真正纳入的人物：William T. Powers。Powers 本是医学物理学家，长期以独立研究者的身份发展了“感知控制理论”（Perceptual Control Theory, PCT）；这套理论的关注对象不仅限于机器或AI，而是生命体的行为本身。

这一点需要先澄清。引入Powers，并非为了给AI寻找一位事后追认的先知，也不是为了将一种边缘理论包装成新的万能钥匙。在此提及PCT，是因为它关乎生命体如何通过层级控制来维持感知状态的理论，并非一套专为人工系统设计的解释框架。

维纳已阐明，目的性行为可由反馈回路产生，无需预设意志。Powers则将这种平面结构进一步深化：真实的控制系统并非单层回路，而是层级嵌套的。低阶系统调节局部误差，高阶系统为低阶系统设定参考值。于是，“控制”不再仅仅是修正偏差，也包含了对“何为偏差”的定义与分配。

Powers在此的重要性在于，他提供了一种更为精细的控制论视角：若缺乏“层级参考值”与“误差定义权”的概念，我们只能说Agent在反馈中修正自身，却无法进一步阐释它为何会被体验为“自主”。至于PCT本身作为一条被主流忽视的控制论支脉，以及其在中文世界几乎未被真正吸纳的历史，将留待后续专题探讨。

PCT的关键洞见在于：真实系统的反馈回路并非扁平，而是层级嵌套的。高阶系统不直接执行动作，它为低阶系统设定参考值；低阶系统并不知晓上层追求的目标，它只负责将局部感知调节至被指派的参考值附近。每一层都有其误差函数，每一层的“目标”皆源自上层的分配。

这将“自主性”转化为一个层级问题，而非非此即彼的属性：谁掌握了更高阶的误差定义权，谁在功能意义上就更“自主”。

在 /goal 场景中，这一结构清晰可见：顶层Agent将用户输入的目标语言解析为中间目标，向下分发参考值；子Agent在局部闭环中执行，向上汇报误差；测试层充当跨层级的误差检测机制，触发更高层的参考值重调。整个系统是一个参考值向下流动、误差信号向上汇报的嵌套结构。

但这里存在一个关键问题：谁设定了最顶层的参考值？这正是本篇需要抓住的结构切口。只要这个问题未得到解答，所谓的“自主性”便仍停留在中间层控制权的扩张，而非目的的内生性。

由此得出本篇的核心论断：Agent的“自主”，是误差定义权在多阶嵌套反馈回路中的上移。它无需意志，所需要的是足够高的层级位置——在给定顶层目标约束下，自行构建中间层目标并重组执行路径的能力。这个“给定”，是整个结构中那个尚未被接管的缺口。

这一论证面临一个无法回避的当代挑战。

2026年5月，Recursive Superintelligence完成6.5亿美元融资，OpenAI与Anthropic都在公开追逐“递归自我改进”（RSI），宣称自家新模型的大部分代码由现有模型自我改进完成；ICLR 2026专门设立RSI工作坊，将其从思想实验推进至正式研究议程。附带的历史叙事也已就位：这是冯·诺依曼“可改进自动机”的当代实现，机器开始修改自身，顶层参考值将不再需要人类注入。

若这是真的，PCT框架中那个“外部注入的天花板”便消失了。

但这一说法需要被拆解审视。

冯·诺依曼在1940年代建立的是关于自我复制的形式模型：一个系统如何生成与自身功能等价的副本。这解决的是结构的保真传递问题，而非结构的定向改进问题。“复制”与“改进”是两个命题——后者还要求能回答“凭什么此方向称为改进”。冯·诺依曼从未触及改进标准的问题，将RSI冠以其名是权威的借用，而非理论的继承。

当前的RSI实践与叙事之间还存在一道真实的落差。如今被称为“递归自我改进”的系统，更准确的描述是：在人类预先建立的评估框架内部，自动寻找更优解。测试约束由谁设定？损失函数由谁设计？发布标准由谁决定？这些判断权仍握在人类手中。系统在框架内部高效运转，并不等同于系统在为自己建立框架。

更深层次的问题在于：即便一个系统能够修改自身的权重与架构，它修改的是语法层的概率结构——神经元连接的权重分布，token预测的条件概率。此类修改能让系统在语法层更高效地寻优，但它无法建立符号与世界之间的指称关系。一个能更快重写自身参数的系统，并不会因此就更理解它处理的符号意味着什么。这不是量的差距，而是两个不同维度的问题。

RSI并未推翻PCT框架，它压缩了控制论的边界：系统修改自身执行结构的能力可以无限扩展，但只要“改进”的标准仍来自外部，误差定义权的顶层位置就没有被接管。

控制论的真正贡献是一种认识论上的自律：看到目的性行为，不要急于投射内在意志；看到层级自主，不要急于宣布意识涌现。这种克制，在“AI能做更多事”的现实压力下，比任何时候都更难坚守，也更加必要。

但控制论也有一个它自身承认的盲区：它对信号的语义内容不感兴趣。对控制论而言，驱动修正的误差信号，无论来自温度传感器还是语言模型的输出层，都是等价的。而我们将这些系统部署在真实的语言环境中，处理带有意义的人类语义表达，生成被当作“理解”来接受的回应——在此语境下，“信号能驱动修正”与“信号携带意义”竟被混为一谈！

控制论说明了Agent如何行动。但Agent处理的“信息”，与人类赋予语言的“意义”，是同一回事吗？若非如此，它们在何处分叉，分叉之后各自通向何方？

这是香农要接手的问题。

本篇完。下篇：香农的机器——统计压缩如何模拟理解

← 上一篇：AI时代组织与人才转型实战课下一篇：黄河交通学院人工智能学院传达第五届理事会精神 →