标签

AI 智能体协作模式解析:何种互动机制最高效?

发布时间:2026-06-14 06:42阅读:1

AI 智能体间的多元互动:哪种协作策略最为奏效?

演示文稿:

https://github.com/createmomo/Notes-on-AI-Agents

往期文章:

历史文章:

关于本笔记的备注:

笔记说明:

面对某些复杂任务时,单一模型往往难以完美应对。此时,与其费力训练一个规模更大、能力更强的模型,不如让三个模型协同合作来共同攻克同一难题。

当遭遇特定任务挑战,单个模型可能已无法出色处理。然而,相较于培育更庞大强劲的模型,促使三个模型联手解决同一问题或许更为高效。

目前学界对此已有大量研究,部分论文指出,允许多个智能体相互探讨,其成果往往优于依赖单个智能体独行。

事实上,围绕该议题的研究已相当丰富。某些文献表明,促成多智能体间彼此交流,或许能比单纯依靠单一智能体取得更佳的成效。

然而,讨论的形式千差万别,究竟何种交流架构方能达成最优效果?

可是,智能体间的研讨模式多种多样,那么怎样的对话结构才能斩获最佳成果呢?

在该论文中,模型之间或智能体之间的交互关系被描绘为有向图。图中每个节点即代表一个模型或智能体。

此项研究里,模型间乃至智能体间的互动皆以有向图呈现。其中,任一节点均象征着一个模型或智能体。

此外,图中的每一条边(edge)本身也代表一个模型。

不仅如此,实际上每条连线(边)亦对应着一个模型。

例如,在此图示中,面对某项任务,前序节点会率先各自提出解决方案;

譬如,在该图谱内,针对特定任务,前置节点将首先独立给出各自的对策;

随后,位于边上的模型会贡献其见解与建议;

接着,处于边线上的模型将输出自身的思路与提议;

最终,末端节点上的模型将整合前述方案与建议,进而阐述其观点。

最后,尾端节点处的模型会统筹之前的策略及意见,从而提出自己的构想。

由此可见,末位节点的任务绝非简单拼凑前文内容,而是融入了独立的思考与判断。

因此我们不难发现,最终节点的职责并非对前置信息进行机械拼接,而是包含了其自身的推理与研判。

既然已掌握基本概念,接下来便看看这篇论文究竟试验了哪些各异的讨论模式。

如今在明晰基础理念后,便可审视该论文具体探索了哪些不同的交流架构。

比如,那种相对简单的顺序传递模式,即类似接龙的链条方式。

例如,存在一种较为简易的依次传递形态,亦即类同于接龙般的链式结构。

另一种模式则是这种树状架构。

另有种方式则是此类树形构造。

但需留意,此处是由一个节点首先生成想法,再传递给其他节点以发散思维,从而衍生出多种方案。

不过此处须加注意,该情境下是某单一节点率先孕育构思,继而转交他人以拓展思路,进而提出多重方案。

这种方式略显反直觉,因为我们通常认为应由树底层的节点先产生想法,再层层向上汇报直至顶端。但此处并非如此。

此法实则稍悖常理,因我们本能或许以为树状底层节点先生成意念,随后逐层上报至顶层节点。然此处情形非也。

总之,在发散出多个方案后,最终会有一个隐藏节点(图中未示出),负责汇总所有方案并给出最终答案。

总而言之,待多重方案发散完毕后,终将存在一个隐匿节点(图面未显),它将统合所有方案以产出最终解答。

除了链式(CHAIN)和树式(TREE)结构,还存在更复杂的形态。例如网状图(Mesh Graph),其特点在于所有节点两两相连。可见,有的节点将想法传给四个节点,有的传给三个,总之任意两节点间均有边连接。

除开链状与树状架构外,尚存更为繁杂的构造。譬如网状图谱,其特质在于每对节点间均存关联。比方说,可见某节点将意念传予四节点,另一节点传予三节点等。简言之,任意两节点间皆有边线相接。

若继续深入观察,会发现类似神经网络的结构。虽外观酷似神经网络,但实际上每个节点均为独立的神经网络模型(毕竟现今模型皆基于神经网络构建)。

倘若我们再向后审视,便会目睹形似神经网络的构造。虽外表宛若神经网络,实则每节点皆为独立之神经网络模型(毕竟当下模型均以神经网络打造)。

再往后看,可见随机生成的图。此类图实则是通过对前述网状图进行随机剪枝(pruning)而得。

若继续向后探视,可见随机生成之图谱。此类图实乃由前文所述网状图经随机剪枝处理而获。

那么,这些各异的讨论方式效果究竟如何?

如此多样的交流模式,其成效到底怎样?

图中横轴大致代表投入的“人力”规模,即参与任务的智能体数量;纵轴则代表任务完成的质量评分。该分数是基于四种不同任务的平均表现计算得出。

此图横坐标约莫指代所调动的“人力”多寡,亦即参与任务之智能体数目;纵坐标则表征任务完成之质量分值。此分值系于四项不同任务上取均值而得。

从左上角的图表可见,效果最差的正是那种一个传一个的链式(Chain)结构。

自左上角图示可辨,成效最逊者,乃是那种依次传递(即链式)的架构。

至于其他方式?论文发现,针对不同任务,最适合的讨论模式也不尽相同。究竟何种模式适配何种任务,只能具体情况具体分析,这其中仍有大量研究空间。

那其余方式又如何?据论文揭示,针对相异任务,最适宜的交流形态亦各有不同。至于何法最配何务,唯有个案剖析,此中尚蕴海量探究余地。

此外,从图中还可看出,随着投入的智能体增多,质量确实随之提升。但这种提升存在上限,一旦超过某个临界点,效果提升便不再显著。

另从该图亦可洞察,伴随投入智能体数目递增,品质确乎随之攀升。然此提升存有极限,一旦超越某阈值,增益效果便不再显著。