标签

最小化意外的Agent统一蓝图:9年前的自由能回声

发布时间:2026-05-04 23:44来源:微信阅读:7

从Friston 的自由能原理到2026 年的 Agent 架构转向——感知、记忆、决策、遗忘,原来可能指向同一个根源

一个让整个行业尴尬的问题

2026 年春天,AI Agent 的赛道热度持续爆表。

Mem0 冲到 4.8 万 Star ,Zep/Graphiti 在时序知识图谱方向打出了差异化, Letta 以操作系统的思路对记忆做分层管理, Hermes Agent 用“越用越聪明”的口号拿下七周 9.5 万 Star 。同时, ReAct 、CoT 、Tree-of- Thought 等推理框架在决策环节不断加码, RAG 管道愈发精细,认知科学启发的遗忘机制也开始进入 Agent 架构。整体节奏看起来繁花似锦。

但如果你把视角拉远一点,会看到一个让人有点不舒服的事实:

这些系统是彼此割裂的。

理解用户意图靠一套模块,记忆读写用另一套,推理规划属于第三套,遗忘机制又是第四套,工具 调用落在第五套。它们之间依赖胶水代码与工程直觉拼起来,没有统一的理论支撑,也缺少一致的优化目标,甚至很少有同一套数学语言去说明"一个 Agent 到底在计算什么"。

这有点像 1900 年代的物理:电磁力、引力、热力学各写各的公式、各讲各的故事。大家都在各自领域推演,却没人真正说清它们之间如何关联。

有没有一种统一理论,能把 Agent 的各种认知活动都纳入同一个解释框架?

线索也许藏在一篇 2017 年发表在 Neural Computation 的研究中。作者是 Karl Friston——如今引用量最高的神经科学家阵营之一。论文题目是 "Active Inference: A Process Theory"(主动推理:一 个过程理论)。它提出一个大胆到接近冒险的观点:大脑的所有活动——感知、学习、记忆、 决策、行动——都能被同一条数学原则归纳起来:最小化变分自由能。

到了 9 年后的今天,AI Agent 行业正用工程方式把这篇论文里的概念一一“重新实现”。只是许多人还没意识到这背后的同源性。

一条公式统摄一切:自由能原理到底在讲什么

先别被"变分自由能"这几个字吓住。它的核心想法其实能用一句话点明:

所有智能行为,本质上都在最小化"意外"。

所谓"意外",并不是心理学里的惊讶,而更接近信息论的含义:某个事件发生的概率越低,它的 "意外 度"(surprise)就越高 。比如鱼在水里——不意外;鱼在树上——意外得几乎“离谱”。

Karl Friston 的自由能原理(Free Energy Principle, FEP)认为,所有自组织系统——从单细胞生物到 人类大脑——都在做同一类事情:让自己尽量保持在"不意外"的状态。更技术地说,它们在最小化一个叫做"变分自由能"的量,这个量始终不会低于真实的意外度。你可以把它看作意外度的一个"保守估计"。

那为什么不直接最小化意外度?原因是直接计算意外度需要掌握世界的完整概率分布,而对任何有限系统来说都做不到。变分自由能则是一个可用近似推理(变分贝叶斯)计算的替代指标,它总是 ≥ 真实意外度。最小化它,就等价于在间接最小化意外。

这个框架最强的地方在于,它把两件原本看起来分属不同领域的事统一到一个逻辑下:

感知 = 更新内部模型,用来解释已经发生的观察(从而降低当前意外)

行动 = 改变外部世界,使其更贴近内部预期(从而降低未来意外)

换句话说,大脑并不是一台被动摄像机,坐着等信号进来再随之反应。它更像一台预测机器:持续生成关于"下一刻会发生什么"的预测,再把预测结果与实际感知做对照。若预测落空(意外度升高),要么更新模型(感知/学习),要么采取行动去重塑世界(行为)。两条路通向同一个目标。

从理论走向神经元:Friston 2017 年论文到底做了什么

"Active Inference: A Process Theory" 这篇论文的贡献,并不是先把自由能原理重新提出一遍——那其实早就有 Friston 更早期的工作。论文真正要做的是更具体、也更野心的一件事:假设神经元活动相当于对自由能做梯度下降,再从这一单一假设出发推导出一大批已知的神经现象。

具体来说,论文以马尔可夫决策过程(MDP)作为生成模型,推导出一套信念更新方程,然后用这些方程去复现:

. 重复抑制(repetition suppression):同一刺激反复出现时,神经反应会减弱——因为预测越来越准确,预测误差不断变小

. 失匹配负波(mismatch negativity):意外刺激会引发更强的神经响应——因为预测被打破

. 位置细胞活动(place-cell activity):海马体中表征空间位置的神经元活动——对应生成模型里对隐藏状态信念的变化

. Theta-gamma 耦合:不同频段脑电波之间的嵌套关系——对应不同时间尺度上的信念更新

. 证据累积(evidence accumulation):决策之前逐步汇聚证据的过程——对应对策略后验概率的更新

. 多巴胺响应转移:奖励信号从无条件刺激转向条件刺激——对应精度(precision)预测误差的变化

一个公式,十几种现象。它并不是事后为了贴合而硬凑:这些现象是从同一组方程自然长出来的。但论文最关键的并非“复现”,而是提出了一套统一的架构。在这套架构里:

. 感知是在每个策略下估计隐藏状态(状态估计)

. 决策会评估每个策略的期望自由能,并用 softmax 选择策略;学习则通过更新生成模型参数(类似赫布式学习)

. 行动通过贝叶斯模型平均预测下一个状态,并选择最可能达成该状态的动作

. 精度编码(对应多巴胺)会调节策略选择的信心水平

所有这些——感知、决策、学习、行动、不确定性编码——都在最小化同一个量:变分自由能。没有五个完全独立的模块,更没有五套各自为政的优化目标。只有一个原理、一套方程、一个统一的计算框架。

2026 年的 AI Agent 行业,正在重新发明这整套思路

现在,把镜头从神经科学拉回到 AI Agent 行业。

如果用 Friston 的视角去审视当前的 Agent 系统,你会发现一个有意思的现象:整个行业正在用工程手段,把主动推理的能力按模块拆开重做。可因为缺少同一套理论坐标,模块之间的连接显得混乱。

我们可以画出一张对应表:

其中最后两行,可能最关键。

在 Friston 的框架里,期望自由能可以拆成两个部分:实用价值(pragmatic value ,也就是期望效用——做对用户有用的事)和认知价值(epistemic value ,也就是信息增益——做能减少不确定性的事)。一个健康的智能体会在两者之间动态切换:当它对世界仍存大量不确定性时,优先探索(最大化认知价 值);当信息已经足够明确,它就转向利用(最大化实用价值)。

而这恰恰是当前 AI Agent 最缺的一块。

现在的大多数 Agent 都偏“利用型”——你给它一个任务,它就直接执行。它很少会在动手前先说:"等等,我对这个项 目的数据库结构不太确定,先查一下再做"。它不会在行动前主动寻找能降低不确定性的关键信息,几乎没有“好奇心”。

有趣的是,行业已经在用最朴素的办法试图弥补这个短板。随便打开任一 AI 编程助手的系统提示词,几乎都会看到类似:"Before answering complex questions, first ask clarifying questions one at a time, until you are confident you understand the request." 这其实就是把“认知价值”用自然语言的方式硬编码出来:强迫 Agent 在不确定时先探索再行动。

但这种补丁很脆弱:它依赖提示词的措辞,没有数学层面的可保证,而且 Agent 无法自行判断"我现在够不够确定"。在主动推理里,这个切换是自动发生的——当期望自由能里的认知价值趋近于零,Agent 自然会从探索模式切换到利用模式,根本不需要外部指令。

还有一个更棘手的局面:OOD( Out-of-Distribution)以及长尾问题。当前训练分布内的 LLM Agent 可能表现亮眼,但一旦面对训练集中罕见、甚至从未出现的情况——例如冷门 API 的用法、非标准的部署方式、小众语言的边界条件——它们往往会依旧自信满满地输出错误结果。原因很简单:它们根本意识不到自己已经"出界"。而这正是精度编码缺失带来的直接后果。

在主动推理框架中,当 Agent 遇到陌生输入,它的生成模 型预测会带来更高的误差,精度就会自动下降,认知价值项随之变大。此时 Agent 会自然进入探索流程:承认不确定性、主动寻找信息、谨慎推进决策。它不需要依靠诸如 "if you're unsure, say so" 之类的提示词去教它怎么做——不确定性本身就是驱动行为的信号。

当然,你也许会说:现在的 Agent 不是也会搜索吗?比如 Kiro 会动手前先搜代码库,Cursor 不确定时去翻文档。没错,但这些动作仍然被外部 harness(编排层)规定好了触发条件与执行尺度:什么时候搜、搜什么、搜到什么程度算够。Agent 自身并不真正理解“为何要搜索”,它只是照着指令做。

而在主动推理中,搜索行为从不确定性中自发涌现。Agent 观察到自身世界模 型与当前输入之间存在偏差,认知价值就会自动上升,探索也随之发生。差别在于:前者是“被告知去探 索”,后者是“因为不确定所以探索”。前者难以迁移泛化,后者才是通用的认知机制。

更深一层的关键,是精度编码的缺失。在主动推理中,精度(precision)是核心概念:它表征 Agent 对每个信念有多确信。高精度意味着“我很确定”,低精度则意味着“我不太确定”。这个信号直接影响决策:低精度信念会被降权,高精度信念更容易主导行为。Friston 的论文也将精度编码对应到了多巴胺系统——多巴胺不是简单的“奖励信号”,而更像“确信度信号”。

当前的 LLM Agent 恰恰缺少这种机制。它们对每一次输出都几乎同等自信——不论是对训练数据中见过成千上万次的题目给出答案,还是在推测它从未真正接触过的领域知识。于是你会看到:Agent 自信满满地编造事实(幻觉),同时也无法在"现在就直接行动"和"先弄清楚状况再说"之间做出可靠判断。

Friston 在 2026 年 4 月接受 diginomica 采访时,对这一问题点到要害。他作为 VERSES AI 的首席科 学家,认为主动推理框架能在 LLM 结构性不足之处胜出——因为它能显式编码不确定性并引出生物学意义上的好奇心。LLM 本质上是一个巨大的条件概率表,它不知道自己不知道什么;而主动推理的 Agent 天然具备这种元认知能力。

从论文到产品:谁在真正搭建这个未来

自由能原理不再只是理论物理学家的“玩具”。在 2024-2026 年间,越来越多的研究与产品开始尝试把它落地成可运行代码。

VERSES AI 和 Genius 平台

Friston 本人担任首席科学家的 VERSES AI ,正把主动推理转化为面向企业的产品形态。他们的 Genius 平台定位为"智能体企业智能平台",主要覆盖数据波动大、模糊度高、不确定性强的复杂场景。

2025年8月,VERSES 获得了一项关键专利——用自然语言去定义主动推理 Agent 的领域模型。2025 年下半年,其团队发表了主动推理在机器人移动操作上的突破性成果,展示了 Agent 在长时间任务中的实时适应,以及面对意外变化时的恢复能力。

与传统强化学习不同,VERSES 的 Agent 不需要海量预训练数据。它们通过构建世界的生成模型来进行推理,而不是依赖大量输入-输出映射的记忆来做反应。用 VERSES 的说法是:"与其学习策略,不如推理 原因。"

"Active Inference for Self-Organizing Multi-LLM Systems"(2024)

这篇 2024 年 12 月的 arxiv 论文,可能是把主动推理与 LLM 结合得最直接的一次尝试。研究团队在 LLM Agent 之上加了一个主动推理的"认知层" ,用它在运行时动态调整交给 LLM 的提示词与搜索策略。

具体而言,这个认知层使用三个状态因子(提示词状态、搜索状态、信息状态)和七个观察模态(质量指标)共同建模环境。通过最小化自由能, Agent 能够系统性地探索不同的提示词组合,评估其效果,并在探索与利用之间自动切换。实验结果显示,Agent 的行为会从早期的广泛信息收集,逐步过渡到更有针对性的提示词检验——这正是主动推理所预期的“先探索后利用”。

这项工作的价值在于:它表明主动推理不必替代 LLM,而更像是能叠加在 LLM 之上的元认知层——让 LLM 保留语言能力的优势,同时获得主动推理带来的自适应与探索特性。

DR-FREE:发表在 Nature 上的鲁棒决策框架(2025)

2025 年,一篇发表在 Nature Communications 上的论文提出了 DR-FREE(Distributionally Robust Free Energy)模型。它将自由能原理与分布鲁棒优化结合起来,让 Agent 在面对世界模型不确定时依旧能够做出可靠决策。

在基准实验中,DR-FREE 让 Agent 即便在一些更先进模型失败的情况下也能完成任务。论文的核心洞察是:传统的自由能最小化常默认世界模型足够准确,但现实中模型总会偏离。DR-FREE 则从最坏情况分布出发优化,把鲁棒性直接嵌入决策机制。

对 AI Agent 来说,这意味着深远影响:基于自由能原理的 Agent 不仅能在理想环境下运作,还能在模型不完美、外界存在噪声的真实世界中保持更稳定的表现。

Orchestrator:多 Agent 长时间任务协调(2025)

另一个值得关注的方向是 Orchestrator 框架。它将主动推理用于多 Agent 系统的长时间任务协调。在部分可观察、需要多方协作才能完成的复杂任务里,Orchestrator 借助注意力机制带来的涌现协同,并结合反思性基准测试来提升整体任务表现。

该框架的关键思想是:每个 Agent 不仅要最小化自身自由能,还要通过共享信念来协调群体行为——这与 Friston 论文里关于"马尔可夫毯"(Markov blanket)的概念高度契合。

重新理解记忆、遗忘与学习

一旦接受自由能原理所给出的统一框架,AI Agent 的记忆、遗忘与学习就不再是三个彼此独立的工程问题,而会变成同一个数学过程的不同侧面。

记忆不是存储,而是信念更新。

在 Friston 的框架里,"记忆"对应的是生成模型参数的更新。论文中的学习方程显示,参数的调整本质上是一种赫布式学习:共同出现的状态关联会被加强,不常出现的关联会被削弱。这并不是"把信息塞进数据库",而是"根据经验改变对世界的信念"。

目前的 Agent 记忆方案——不论是 Mem0 的向量+图谱混合存储,还是 Zep/Graphiti 的时序知识图谱,甚至是简单的 Markdown 文件——本质上都在做“存储与检索”。它们把记忆当成一个数据库问题。但自由能框架提示:更关键的记忆应该属于生成模型本身——不是"我保存了什么",而是"我的世界模型因为这些经验变成了什么样"。

这并非纯粹的语言偏好。它会直接影响工程设计:如果记忆是生成模型参数的一部分,那么“记住一件事”就意味着 Agent 对未来的预测方式发生改变,从而连带影响其感知、决策与行动。相反,如果记忆只是数据库中的一条记录,它只有在被检索到时才发挥作用,而且与 Agent 的其它认知环节容易脱节。

遗忘不是漏洞,而是精度加权的自然结果。

在主动推理里,每个信念都带着一个"精度"(precision),表示对它的确信程度。精度低的信念对行为影响较小,精度高的信念影响更大。随着时间推移与新证据加入,旧信念的精度会自然衰减——这就是遗忘。

2026 年初,越来越多研究者开始把这一点讲清。一篇题为 "AI Agents Need Memory Control Over More Context" 的论文指出,当前依靠转录回放或检索的记忆机制容易导致上下文无限膨胀,并可能被噪声召回与记忆污染拖累,最终让 Agent 行为变得不稳定、发生漂移。

这正是缺乏精度编码的后果:系统无法区分"高确信度的核心记忆"与"低确信度的噪声信息",只能对所有内容一视同仁地选择保留或丢弃。

不过,这类工作与主动推理之间仍有关键差异:前者的衰减与组织规则往往是预设的;而主动推理中的精度来自对数据的推断。换言之,一个真正基于自由能原理的遗忘系统,不需要人为设计衰减曲线,它会根据信息的真实有用性自动调节遗忘速度。

学习不是微调,而是降低意外。

现在 AI Agent 所谓的“学习”,通常指两类事情:更新知识库(加入新文档),或优化提示词(根据反馈调整系统提示)。这两种方式都偏局部、也偏被动。

在主动推理中,学习是更深层的过程。Agent 通过与环境交互,不断更新其生成模型的全部参数——不仅仅是"知道了什么新事实",还包括"因果结构大致是什么样"、"不同状态之间的转移概率究竟如何变化"、"我的行动会带来哪些后果"。这种学习是全局且主动的,并且与感知、决策共享同一个优化目标。

Friston 论文里最优雅的结果之一,是展示习惯如何从目标导向行为中自然涌现。在模拟实验中,Agent 早期通过主动探索来学习环境(认知行为)。随着熟悉度不断上升,它会逐渐形成更固定的行为模式(习惯)——整个过程不需要额外机制,仅仅是信念更新的自然结果。

对 AI Agent 的启示是:与其手动设计"何时探索、何时利用",不如让 Agent 在一个统一框架下自动完成这种转换。

美丽的理论,和残酷的现实

写到这里,你可能会觉得自由能原理就是 AI Agent 的万能解药。但坦诚一点,它仍面临严峻挑战。

可扩展性问题。Friston 论文里的模拟实验只使用了 8 个隐藏状态、4 个动作的 T 型迷宫。真实世界里的 AI Agent 所面对的状态空间却大到无法想象。尽管 VERSES AI 及其他团队在工程化方面已经取得进展,但要把主动推理扩展到 LLM 级复杂度,依然是未解决的难题。2024 年那篇 Multi-LLM 论 文给出了一个有希望的方向,但实验规模仍然有限。

计算成本。期望自由能的计算需要枚举并评估未来状态。在离散状态空间里这还相对可行,但当进入连续、高维空间,计算开销会迅速爆炸式增长。正如一篇 2025 年的 arxiv 论文所指出的:"期望自 由能最小化的计算成本限制了其可扩展性"。

与 LLM 的整合。LLM 本质是一个自回归的 token 预测器,它的内部表示与主动推理所用生成模型之间并没有天然的对应关系。把主动推理当作 LLM 之上的元认知层属于务实选择,但这也意味着两个系统之间存在"阻抗不匹配"——由于 LLM 的黑箱特性,主动推理层很难准确刻画 LLM 的行为机制。

理论争议。自由能原理在学界并非没有质疑声音。有些批评者认为它过于宽泛:如果万事都能用最小化自由能来解释,那到底算不算真正解释?这点有道理——一个似乎“能解释一切”的理论,可能本身并没有解释什么。可 Friston 2017 年论文真正有价值的地方在于,它不是停留在抽象原则,而是给出可以被检验(或证伪)的具体过程预测。

结语:下一代突破性 Agent,或许不在于最好的模型,而在于最好的世界模型

2026 年的 AI Agent 行业有个讽刺:工程师们花了两年,用工程直觉逐块重建神经科学家十年前已形式化的认知架构。记忆系统对应参数学习,推理链对应策略评估,遗忘机制对应精度衰减,RAG 对应长期记忆到工作记忆的检索。只是始终没人把这些组件放进同一个框架里,也没人给出统一的优化目标。

Friston 的自由能原理正好提供了这个框架。它不是从零开始重造的全新架构,而是一种可以统一现有组件的理论透镜。当你用它审视当前的 Agent 系统,就能看到缺失的拼图:认知价值(驱动探索)、精度编码(对不确定性的显式建模),以及统一优化目标(而不是五个模块各自为战)。

真正的突破性 Agent,未必是拥有更大的上下文窗口、最快的推理速度,或最多的工具调用能力。它可能是第一类真正具备世界模型的 Agent——一个能预测、能探索、能遗忘、能学习的生成模型,而所有能力都从同一个原理中自然涌现。

Karl Friston 在 2017 年写下那篇论文时,或许没想到它会与 AI Agent 产生交集。但在 9 年后的今天,当整个 行业都在追问"Agent 的下一步是什么",答案也许一直就在原处——藏在一个围绕大脑如何最小化意外的优雅数学框架里。