控制论视角:AI自主决策的虚幻本质 | 机器智能与真实性危机(二)
无论是Claude Code还是Codex,都支持一种操作:用户输入一个复杂的 /goal 指令,描述目标,然后关闭屏幕。系统会自动拆解任务,指挥子代理集群,规划步骤,应对中途的失败,尝试重试,更换路径,直到产出一份完整的交付报告。在此期间,人类并不在场。
这给人类留下了一个极其强烈的印象:这个系统正在自主地完成任务。
但“印象强烈”本身或许就是一种行动层面的“自主性错觉”,必须冷静剖析。首先,有两个必须厘清的问题——谁决定下一步做什么,以及谁定义什么算做完——这二者并非同一回事,而大多数关于“AI自主性”的讨论,往往将它们混淆了。
若把该场景的结构拆解来看:系统并非“输入、处理、输出”的单向流程。它实际上在进行持续的感知、比对与修正。运行一段代码,观察是否报错;将当前状态与参考状态对比,计算偏差;生成修正动作,再次执行,再次观察。这个循环不会在初次输出后终止,它会持续运转,直到误差收敛至可接受范围。
这种结构被称为反馈回路,在工程控制领域已应用了八十年。它并不神秘,也不独属于AI。恒温器感知室温,与设定值对比,触发制热或制冷,这是反馈回路。自动驾驶感知偏航,与目标轨迹比对,调整转向,这也是反馈回路。一个多代理的长任务系统,在结构上与恒温器属于同一类事物。区别仅在于感知对象的维度、误差函数的复杂度、动作空间的大小——而非结构类型本身。
这一区分的意义在于:复杂并不代表无法用结构解释,“像人”也不等同于“就是人”。
1948年,Norbert Wiener 出版了《控制论》,其副标题充满挑衅意味:关于在动物和机器中控制与通信的科学。核心论点简明扼要:目的性行为无需预设内在意志,任何装备了适当负反馈回路的系统,都能稳定地展现出“朝向目标、受阻时调整”的外在表现。
维纳并未宣称机器拥有了意志,恰恰相反——他将“意志”从目的性行为的必要前提中剥离了。控制论诞生后,你不能仅凭“该系统在追求目标”就断定它在“思考”或“理解”。
但控制论的精确性同时也界定了其边界。维纳的框架描述的是目的性行为的结构形式,对于回路中流动的信号承载何种语义内容,它保持沉默。在控制论框架内,恒温器的温度传感器和工程师阅读的错误日志,都是等价的误差信号——只要能驱动修正动作即可,信号是否被“理解”,控制论不予过问。
这种沉默在1948年是自觉的。维纳关注的是行为形式,是火炮和导弹的精确命中,而非符号或语言的意义问题。但在后来关于AI的大众叙事中,这一边界被系统性遗忘了。
此处需要引入一个在中文语境中颇为陌生、在英文主流正典中也未被真正纳入的人物:William T. Powers。Powers 本是医学物理学家,长期以独立研究者的身份发展了“感知控制理论”(Perceptual Control Theory, PCT);这套理论的关注对象不仅限于机器或AI,而是生命体的行为本身。
这一点需要先澄清。引入Powers,并非为了给AI寻找一位事后追认的先知,也不是为了将一种边缘理论包装成新的万能钥匙。在此提及PCT,是因为它关乎生命体如何通过层级控制来维持感知状态的理论,并非一套专为人工系统设计的解释框架。
维纳已阐明,目的性行为可由反馈回路产生,无需预设意志。Powers则将这种平面结构进一步深化:真实的控制系统并非单层回路,而是层级嵌套的。低阶系统调节局部误差,高阶系统为低阶系统设定参考值。于是,“控制”不再仅仅是修正偏差,也包含了对“何为偏差”的定义与分配。
Powers在此的重要性在于,他提供了一种更为精细的控制论视角:若缺乏“层级参考值”与“误差定义权”的概念,我们只能说Agent在反馈中修正自身,却无法进一步阐释它为何会被体验为“自主”。至于PCT本身作为一条被主流忽视的控制论支脉,以及其在中文世界几乎未被真正吸纳的历史,将留待后续专题探讨。
PCT的关键洞见在于:真实系统的反馈回路并非扁平,而是层级嵌套的。高阶系统不直接执行动作,它为低阶系统设定参考值;低阶系统并不知晓上层追求的目标,它只负责将局部感知调节至被指派的参考值附近。每一层都有其误差函数,每一层的“目标”皆源自上层的分配。
这将“自主性”转化为一个层级问题,而非非此即彼的属性:谁掌握了更高阶的误差定义权,谁在功能意义上就更“自主”。
在 /goal 场景中,这一结构清晰可见:顶层Agent将用户输入的目标语言解析为中间目标,向下分发参考值;子Agent在局部闭环中执行,向上汇报误差;测试层充当跨层级的误差检测机制,触发更高层的参考值重调。整个系统是一个参考值向下流动、误差信号向上汇报的嵌套结构。
但这里存在一个关键问题:谁设定了最顶层的参考值?这正是本篇需要抓住的结构切口。只要这个问题未得到解答,所谓的“自主性”便仍停留在中间层控制权的扩张,而非目的的内生性。
由此得出本篇的核心论断:Agent的“自主”,是误差定义权在多阶嵌套反馈回路中的上移。它无需意志,所需要的是足够高的层级位置——在给定顶层目标约束下,自行构建中间层目标并重组执行路径的能力。这个“给定”,是整个结构中那个尚未被接管的缺口。
这一论证面临一个无法回避的当代挑战。
2026年5月,Recursive Superintelligence完成6.5亿美元融资,OpenAI与Anthropic都在公开追逐“递归自我改进”(RSI),宣称自家新模型的大部分代码由现有模型自我改进完成;ICLR 2026专门设立RSI工作坊,将其从思想实验推进至正式研究议程。附带的历史叙事也已就位:这是冯·诺依曼“可改进自动机”的当代实现,机器开始修改自身,顶层参考值将不再需要人类注入。
若这是真的,PCT框架中那个“外部注入的天花板”便消失了。
但这一说法需要被拆解审视。
冯·诺依曼在1940年代建立的是关于自我复制的形式模型:一个系统如何生成与自身功能等价的副本。这解决的是结构的保真传递问题,而非结构的定向改进问题。“复制”与“改进”是两个命题——后者还要求能回答“凭什么此方向称为改进”。冯·诺依曼从未触及改进标准的问题,将RSI冠以其名是权威的借用,而非理论的继承。
当前的RSI实践与叙事之间还存在一道真实的落差。如今被称为“递归自我改进”的系统,更准确的描述是:在人类预先建立的评估框架内部,自动寻找更优解。测试约束由谁设定?损失函数由谁设计?发布标准由谁决定?这些判断权仍握在人类手中。系统在框架内部高效运转,并不等同于系统在为自己建立框架。
更深层次的问题在于:即便一个系统能够修改自身的权重与架构,它修改的是语法层的概率结构——神经元连接的权重分布,token预测的条件概率。此类修改能让系统在语法层更高效地寻优,但它无法建立符号与世界之间的指称关系。一个能更快重写自身参数的系统,并不会因此就更理解它处理的符号意味着什么。这不是量的差距,而是两个不同维度的问题。
RSI并未推翻PCT框架,它压缩了控制论的边界:系统修改自身执行结构的能力可以无限扩展,但只要“改进”的标准仍来自外部,误差定义权的顶层位置就没有被接管。
控制论的真正贡献是一种认识论上的自律:看到目的性行为,不要急于投射内在意志;看到层级自主,不要急于宣布意识涌现。这种克制,在“AI能做更多事”的现实压力下,比任何时候都更难坚守,也更加必要。
但控制论也有一个它自身承认的盲区:它对信号的语义内容不感兴趣。对控制论而言,驱动修正的误差信号,无论来自温度传感器还是语言模型的输出层,都是等价的。而我们将这些系统部署在真实的语言环境中,处理带有意义的人类语义表达,生成被当作“理解”来接受的回应——在此语境下,“信号能驱动修正”与“信号携带意义”竟被混为一谈!
控制论说明了Agent如何行动。但Agent处理的“信息”,与人类赋予语言的“意义”,是同一回事吗?若非如此,它们在何处分叉,分叉之后各自通向何方?
这是香农要接手的问题。
本篇完。下篇:香农的机器——统计压缩如何模拟理解