最小化意外的Agent统一蓝图：9年前的自由能回声

发布时间：2026-05-04 23:44阅读：13

从Friston 的自由能原理到2026 年的 Agent 架构转向——感知、记忆、决策、遗忘，原来可能指向同一个根源

一个让整个行业尴尬的问题

2026 年春天，AI Agent 的赛道热度持续爆表。

Mem0 冲到 4.8 万 Star ，Zep/Graphiti 在时序知识图谱方向打出了差异化， Letta 以操作系统的思路对记忆做分层管理， Hermes Agent 用“越用越聪明”的口号拿下七周 9.5 万 Star 。同时， ReAct 、CoT 、Tree-of- Thought 等推理框架在决策环节不断加码， RAG 管道愈发精细，认知科学启发的遗忘机制也开始进入 Agent 架构。整体节奏看起来繁花似锦。

但如果你把视角拉远一点，会看到一个让人有点不舒服的事实：

这些系统是彼此割裂的。

理解用户意图靠一套模块，记忆读写用另一套，推理规划属于第三套，遗忘机制又是第四套，工具调用落在第五套。它们之间依赖胶水代码与工程直觉拼起来，没有统一的理论支撑，也缺少一致的优化目标，甚至很少有同一套数学语言去说明"一个 Agent 到底在计算什么"。

这有点像 1900 年代的物理：电磁力、引力、热力学各写各的公式、各讲各的故事。大家都在各自领域推演，却没人真正说清它们之间如何关联。

有没有一种统一理论，能把 Agent 的各种认知活动都纳入同一个解释框架？

线索也许藏在一篇 2017 年发表在 Neural Computation 的研究中。作者是 Karl Friston——如今引用量最高的神经科学家阵营之一。论文题目是 "Active Inference: A Process Theory"（主动推理：一个过程理论）。它提出一个大胆到接近冒险的观点：大脑的所有活动——感知、学习、记忆、决策、行动——都能被同一条数学原则归纳起来：最小化变分自由能。

到了 9 年后的今天，AI Agent 行业正用工程方式把这篇论文里的概念一一“重新实现”。只是许多人还没意识到这背后的同源性。

一条公式统摄一切：自由能原理到底在讲什么

先别被"变分自由能"这几个字吓住。它的核心想法其实能用一句话点明：

所有智能行为，本质上都在最小化"意外"。

所谓"意外"，并不是心理学里的惊讶，而更接近信息论的含义：某个事件发生的概率越低，它的 "意外度"（surprise）就越高。比如鱼在水里——不意外；鱼在树上——意外得几乎“离谱”。

Karl Friston 的自由能原理（Free Energy Principle, FEP）认为，所有自组织系统——从单细胞生物到人类大脑——都在做同一类事情：让自己尽量保持在"不意外"的状态。更技术地说，它们在最小化一个叫做"变分自由能"的量，这个量始终不会低于真实的意外度。你可以把它看作意外度的一个"保守估计"。

那为什么不直接最小化意外度？原因是直接计算意外度需要掌握世界的完整概率分布，而对任何有限系统来说都做不到。变分自由能则是一个可用近似推理（变分贝叶斯）计算的替代指标，它总是 ≥ 真实意外度。最小化它，就等价于在间接最小化意外。

这个框架最强的地方在于，它把两件原本看起来分属不同领域的事统一到一个逻辑下：

感知 = 更新内部模型，用来解释已经发生的观察（从而降低当前意外）

行动 = 改变外部世界，使其更贴近内部预期（从而降低未来意外）

换句话说，大脑并不是一台被动摄像机，坐着等信号进来再随之反应。它更像一台预测机器：持续生成关于"下一刻会发生什么"的预测，再把预测结果与实际感知做对照。若预测落空（意外度升高），要么更新模型（感知/学习），要么采取行动去重塑世界（行为）。两条路通向同一个目标。

从理论走向神经元：Friston 2017 年论文到底做了什么

"Active Inference: A Process Theory" 这篇论文的贡献，并不是先把自由能原理重新提出一遍——那其实早就有 Friston 更早期的工作。论文真正要做的是更具体、也更野心的一件事：假设神经元活动相当于对自由能做梯度下降，再从这一单一假设出发推导出一大批已知的神经现象。

具体来说，论文以马尔可夫决策过程（MDP）作为生成模型，推导出一套信念更新方程，然后用这些方程去复现：

. 重复抑制（repetition suppression）：同一刺激反复出现时，神经反应会减弱——因为预测越来越准确，预测误差不断变小

. 失匹配负波（mismatch negativity）：意外刺激会引发更强的神经响应——因为预测被打破

. 位置细胞活动（place-cell activity）：海马体中表征空间位置的神经元活动——对应生成模型里对隐藏状态信念的变化

. Theta-gamma 耦合：不同频段脑电波之间的嵌套关系——对应不同时间尺度上的信念更新

. 证据累积（evidence accumulation）：决策之前逐步汇聚证据的过程——对应对策略后验概率的更新

. 多巴胺响应转移：奖励信号从无条件刺激转向条件刺激——对应精度（precision）预测误差的变化

一个公式，十几种现象。它并不是事后为了贴合而硬凑：这些现象是从同一组方程自然长出来的。但论文最关键的并非“复现”，而是提出了一套统一的架构。在这套架构里：

. 感知是在每个策略下估计隐藏状态（状态估计）

. 决策会评估每个策略的期望自由能，并用 softmax 选择策略；学习则通过更新生成模型参数（类似赫布式学习）

. 行动通过贝叶斯模型平均预测下一个状态，并选择最可能达成该状态的动作

. 精度编码（对应多巴胺）会调节策略选择的信心水平

所有这些——感知、决策、学习、行动、不确定性编码——都在最小化同一个量：变分自由能。没有五个完全独立的模块，更没有五套各自为政的优化目标。只有一个原理、一套方程、一个统一的计算框架。

2026 年的 AI Agent 行业，正在重新发明这整套思路

现在，把镜头从神经科学拉回到 AI Agent 行业。

如果用 Friston 的视角去审视当前的 Agent 系统，你会发现一个有意思的现象：整个行业正在用工程手段，把主动推理的能力按模块拆开重做。可因为缺少同一套理论坐标，模块之间的连接显得混乱。

我们可以画出一张对应表：

其中最后两行，可能最关键。

在 Friston 的框架里，期望自由能可以拆成两个部分：实用价值（pragmatic value ，也就是期望效用——做对用户有用的事）和认知价值（epistemic value ，也就是信息增益——做能减少不确定性的事）。一个健康的智能体会在两者之间动态切换：当它对世界仍存大量不确定性时，优先探索（最大化认知价值）；当信息已经足够明确，它就转向利用（最大化实用价值）。

而这恰恰是当前 AI Agent 最缺的一块。

现在的大多数 Agent 都偏“利用型”——你给它一个任务，它就直接执行。它很少会在动手前先说："等等，我对这个项目的数据库结构不太确定，先查一下再做"。它不会在行动前主动寻找能降低不确定性的关键信息，几乎没有“好奇心”。

有趣的是，行业已经在用最朴素的办法试图弥补这个短板。随便打开任一 AI 编程助手的系统提示词，几乎都会看到类似："Before answering complex questions, first ask clarifying questions one at a time, until you are confident you understand the request." 这其实就是把“认知价值”用自然语言的方式硬编码出来：强迫 Agent 在不确定时先探索再行动。

但这种补丁很脆弱：它依赖提示词的措辞，没有数学层面的可保证，而且 Agent 无法自行判断"我现在够不够确定"。在主动推理里，这个切换是自动发生的——当期望自由能里的认知价值趋近于零，Agent 自然会从探索模式切换到利用模式，根本不需要外部指令。

还有一个更棘手的局面：OOD（ Out-of-Distribution）以及长尾问题。当前训练分布内的 LLM Agent 可能表现亮眼，但一旦面对训练集中罕见、甚至从未出现的情况——例如冷门 API 的用法、非标准的部署方式、小众语言的边界条件——它们往往会依旧自信满满地输出错误结果。原因很简单：它们根本意识不到自己已经"出界"。而这正是精度编码缺失带来的直接后果。

在主动推理框架中，当 Agent 遇到陌生输入，它的生成模型预测会带来更高的误差，精度就会自动下降，认知价值项随之变大。此时 Agent 会自然进入探索流程：承认不确定性、主动寻找信息、谨慎推进决策。它不需要依靠诸如 "if you're unsure, say so" 之类的提示词去教它怎么做——不确定性本身就是驱动行为的信号。

当然，你也许会说：现在的 Agent 不是也会搜索吗？比如 Kiro 会动手前先搜代码库，Cursor 不确定时去翻文档。没错，但这些动作仍然被外部 harness（编排层）规定好了触发条件与执行尺度：什么时候搜、搜什么、搜到什么程度算够。Agent 自身并不真正理解“为何要搜索”，它只是照着指令做。

而在主动推理中，搜索行为从不确定性中自发涌现。Agent 观察到自身世界模型与当前输入之间存在偏差，认知价值就会自动上升，探索也随之发生。差别在于：前者是“被告知去探索”，后者是“因为不确定所以探索”。前者难以迁移泛化，后者才是通用的认知机制。

更深一层的关键，是精度编码的缺失。在主动推理中，精度（precision）是核心概念：它表征 Agent 对每个信念有多确信。高精度意味着“我很确定”，低精度则意味着“我不太确定”。这个信号直接影响决策：低精度信念会被降权，高精度信念更容易主导行为。Friston 的论文也将精度编码对应到了多巴胺系统——多巴胺不是简单的“奖励信号”，而更像“确信度信号”。

当前的 LLM Agent 恰恰缺少这种机制。它们对每一次输出都几乎同等自信——不论是对训练数据中见过成千上万次的题目给出答案，还是在推测它从未真正接触过的领域知识。于是你会看到：Agent 自信满满地编造事实（幻觉），同时也无法在"现在就直接行动"和"先弄清楚状况再说"之间做出可靠判断。

Friston 在 2026 年 4 月接受 diginomica 采访时，对这一问题点到要害。他作为 VERSES AI 的首席科学家，认为主动推理框架能在 LLM 结构性不足之处胜出——因为它能显式编码不确定性并引出生物学意义上的好奇心。LLM 本质上是一个巨大的条件概率表，它不知道自己不知道什么；而主动推理的 Agent 天然具备这种元认知能力。

从论文到产品：谁在真正搭建这个未来

自由能原理不再只是理论物理学家的“玩具”。在 2024-2026 年间，越来越多的研究与产品开始尝试把它落地成可运行代码。

VERSES AI 和 Genius 平台

Friston 本人担任首席科学家的 VERSES AI ，正把主动推理转化为面向企业的产品形态。他们的 Genius 平台定位为"智能体企业智能平台"，主要覆盖数据波动大、模糊度高、不确定性强的复杂场景。

2025年8月，VERSES 获得了一项关键专利——用自然语言去定义主动推理 Agent 的领域模型。2025 年下半年，其团队发表了主动推理在机器人移动操作上的突破性成果，展示了 Agent 在长时间任务中的实时适应，以及面对意外变化时的恢复能力。

与传统强化学习不同，VERSES 的 Agent 不需要海量预训练数据。它们通过构建世界的生成模型来进行推理，而不是依赖大量输入-输出映射的记忆来做反应。用 VERSES 的说法是："与其学习策略，不如推理原因。"

"Active Inference for Self-Organizing Multi-LLM Systems"（2024）

这篇 2024 年 12 月的 arxiv 论文，可能是把主动推理与 LLM 结合得最直接的一次尝试。研究团队在 LLM Agent 之上加了一个主动推理的"认知层" ，用它在运行时动态调整交给 LLM 的提示词与搜索策略。

具体而言，这个认知层使用三个状态因子（提示词状态、搜索状态、信息状态）和七个观察模态（质量指标）共同建模环境。通过最小化自由能， Agent 能够系统性地探索不同的提示词组合，评估其效果，并在探索与利用之间自动切换。实验结果显示，Agent 的行为会从早期的广泛信息收集，逐步过渡到更有针对性的提示词检验——这正是主动推理所预期的“先探索后利用”。

这项工作的价值在于：它表明主动推理不必替代 LLM，而更像是能叠加在 LLM 之上的元认知层——让 LLM 保留语言能力的优势，同时获得主动推理带来的自适应与探索特性。

DR-FREE：发表在 Nature 上的鲁棒决策框架（2025）

2025 年，一篇发表在 Nature Communications 上的论文提出了 DR-FREE（Distributionally Robust Free Energy）模型。它将自由能原理与分布鲁棒优化结合起来，让 Agent 在面对世界模型不确定时依旧能够做出可靠决策。

在基准实验中，DR-FREE 让 Agent 即便在一些更先进模型失败的情况下也能完成任务。论文的核心洞察是：传统的自由能最小化常默认世界模型足够准确，但现实中模型总会偏离。DR-FREE 则从最坏情况分布出发优化，把鲁棒性直接嵌入决策机制。

对 AI Agent 来说，这意味着深远影响：基于自由能原理的 Agent 不仅能在理想环境下运作，还能在模型不完美、外界存在噪声的真实世界中保持更稳定的表现。

Orchestrator：多 Agent 长时间任务协调（2025）

另一个值得关注的方向是 Orchestrator 框架。它将主动推理用于多 Agent 系统的长时间任务协调。在部分可观察、需要多方协作才能完成的复杂任务里，Orchestrator 借助注意力机制带来的涌现协同，并结合反思性基准测试来提升整体任务表现。

该框架的关键思想是：每个 Agent 不仅要最小化自身自由能，还要通过共享信念来协调群体行为——这与 Friston 论文里关于"马尔可夫毯"（Markov blanket）的概念高度契合。

重新理解记忆、遗忘与学习

一旦接受自由能原理所给出的统一框架，AI Agent 的记忆、遗忘与学习就不再是三个彼此独立的工程问题，而会变成同一个数学过程的不同侧面。

记忆不是存储，而是信念更新。

在 Friston 的框架里，"记忆"对应的是生成模型参数的更新。论文中的学习方程显示，参数的调整本质上是一种赫布式学习：共同出现的状态关联会被加强，不常出现的关联会被削弱。这并不是"把信息塞进数据库"，而是"根据经验改变对世界的信念"。

目前的 Agent 记忆方案——不论是 Mem0 的向量+图谱混合存储，还是 Zep/Graphiti 的时序知识图谱，甚至是简单的 Markdown 文件——本质上都在做“存储与检索”。它们把记忆当成一个数据库问题。但自由能框架提示：更关键的记忆应该属于生成模型本身——不是"我保存了什么"，而是"我的世界模型因为这些经验变成了什么样"。

这并非纯粹的语言偏好。它会直接影响工程设计：如果记忆是生成模型参数的一部分，那么“记住一件事”就意味着 Agent 对未来的预测方式发生改变，从而连带影响其感知、决策与行动。相反，如果记忆只是数据库中的一条记录，它只有在被检索到时才发挥作用，而且与 Agent 的其它认知环节容易脱节。

遗忘不是漏洞，而是精度加权的自然结果。

在主动推理里，每个信念都带着一个"精度"（precision），表示对它的确信程度。精度低的信念对行为影响较小，精度高的信念影响更大。随着时间推移与新证据加入，旧信念的精度会自然衰减——这就是遗忘。

2026 年初，越来越多研究者开始把这一点讲清。一篇题为 "AI Agents Need Memory Control Over More Context" 的论文指出，当前依靠转录回放或检索的记忆机制容易导致上下文无限膨胀，并可能被噪声召回与记忆污染拖累，最终让 Agent 行为变得不稳定、发生漂移。

这正是缺乏精度编码的后果：系统无法区分"高确信度的核心记忆"与"低确信度的噪声信息"，只能对所有内容一视同仁地选择保留或丢弃。

不过，这类工作与主动推理之间仍有关键差异：前者的衰减与组织规则往往是预设的；而主动推理中的精度来自对数据的推断。换言之，一个真正基于自由能原理的遗忘系统，不需要人为设计衰减曲线，它会根据信息的真实有用性自动调节遗忘速度。

学习不是微调，而是降低意外。

现在 AI Agent 所谓的“学习”，通常指两类事情：更新知识库（加入新文档），或优化提示词（根据反馈调整系统提示）。这两种方式都偏局部、也偏被动。

在主动推理中，学习是更深层的过程。Agent 通过与环境交互，不断更新其生成模型的全部参数——不仅仅是"知道了什么新事实"，还包括"因果结构大致是什么样"、"不同状态之间的转移概率究竟如何变化"、"我的行动会带来哪些后果"。这种学习是全局且主动的，并且与感知、决策共享同一个优化目标。

Friston 论文里最优雅的结果之一，是展示习惯如何从目标导向行为中自然涌现。在模拟实验中，Agent 早期通过主动探索来学习环境（认知行为）。随着熟悉度不断上升，它会逐渐形成更固定的行为模式（习惯）——整个过程不需要额外机制，仅仅是信念更新的自然结果。

对 AI Agent 的启示是：与其手动设计"何时探索、何时利用"，不如让 Agent 在一个统一框架下自动完成这种转换。

美丽的理论，和残酷的现实

写到这里，你可能会觉得自由能原理就是 AI Agent 的万能解药。但坦诚一点，它仍面临严峻挑战。

可扩展性问题。Friston 论文里的模拟实验只使用了 8 个隐藏状态、4 个动作的 T 型迷宫。真实世界里的 AI Agent 所面对的状态空间却大到无法想象。尽管 VERSES AI 及其他团队在工程化方面已经取得进展，但要把主动推理扩展到 LLM 级复杂度，依然是未解决的难题。2024 年那篇 Multi-LLM 论文给出了一个有希望的方向，但实验规模仍然有限。

计算成本。期望自由能的计算需要枚举并评估未来状态。在离散状态空间里这还相对可行，但当进入连续、高维空间，计算开销会迅速爆炸式增长。正如一篇 2025 年的 arxiv 论文所指出的："期望自由能最小化的计算成本限制了其可扩展性"。

与 LLM 的整合。LLM 本质是一个自回归的 token 预测器，它的内部表示与主动推理所用生成模型之间并没有天然的对应关系。把主动推理当作 LLM 之上的元认知层属于务实选择，但这也意味着两个系统之间存在"阻抗不匹配"——由于 LLM 的黑箱特性，主动推理层很难准确刻画 LLM 的行为机制。

理论争议。自由能原理在学界并非没有质疑声音。有些批评者认为它过于宽泛：如果万事都能用最小化自由能来解释，那到底算不算真正解释？这点有道理——一个似乎“能解释一切”的理论，可能本身并没有解释什么。可 Friston 2017 年论文真正有价值的地方在于，它不是停留在抽象原则，而是给出可以被检验（或证伪）的具体过程预测。

结语：下一代突破性 Agent，或许不在于最好的模型，而在于最好的世界模型

2026 年的 AI Agent 行业有个讽刺：工程师们花了两年，用工程直觉逐块重建神经科学家十年前已形式化的认知架构。记忆系统对应参数学习，推理链对应策略评估，遗忘机制对应精度衰减，RAG 对应长期记忆到工作记忆的检索。只是始终没人把这些组件放进同一个框架里，也没人给出统一的优化目标。

Friston 的自由能原理正好提供了这个框架。它不是从零开始重造的全新架构，而是一种可以统一现有组件的理论透镜。当你用它审视当前的 Agent 系统，就能看到缺失的拼图：认知价值（驱动探索）、精度编码（对不确定性的显式建模），以及统一优化目标（而不是五个模块各自为战）。

真正的突破性 Agent，未必是拥有更大的上下文窗口、最快的推理速度，或最多的工具调用能力。它可能是第一类真正具备世界模型的 Agent——一个能预测、能探索、能遗忘、能学习的生成模型，而所有能力都从同一个原理中自然涌现。

Karl Friston 在 2017 年写下那篇论文时，或许没想到它会与 AI Agent 产生交集。但在 9 年后的今天，当整个行业都在追问"Agent 的下一步是什么"，答案也许一直就在原处——藏在一个围绕大脑如何最小化意外的优雅数学框架里。

← 上一篇：AI法律顾问证书6月27日启动｜工信部人才交流中心认证下一篇：AI视频创作之路 →