重新定义AI智能体进化的秘密武器——Hermes Agent为何能脱颖而出
就在今天,Hermes的Github Star数已超过87k,成为当下最热门的开源 AI 智能体之一。
我想聚焦它最核心的两个创新点:记忆和Skills系统,来读懂它的特别之处。
记忆
Hermes采用分层记忆,让每一层各司其职,同时它们之间可以自动流动。
1. 两个核心记忆文件
Hermes使用两个持久化文件来存储核心记忆,位于用户目录的~/.hermes/memories/下。
第一个是MEMORY.md,这是Agent的工作笔记本,容量上限2200个字符,用来存储Agent自己的工作笔记、重要发现、任务进度和偏好设置。比如它会记录"用户喜欢简洁的回答,不需要冗余解释"、"代码示例优先使用Python"、"当前项目是new-api,使用Go+React技术栈"这类信息。
第二个是USER.md,这是用户档案柜,容量上限1375个字符,用来存储用户的个人信息、习惯和背景知识。比如它会记录"用户是全栈开发者,技术栈包括Go、Python、React"、"喜欢TDD开发方式"、"沟通风格直接简洁"这类画像信息。
两个文件加起来最多只有3575个字符,字符上限被"故意收窄"。因为Hermes团队认为,记忆不是垃圾桶,容量限制会强迫用户定期筛选,真正重要的信息才会被保留下来。这就像我们不可能记住生活的每一个细节,Agent也一样——它需要学会遗忘那些无关紧要的内容。
2. 记忆注入机制
记忆内容在会话开始时作为冻结快照注入到上下文中:
这种设计有两个核心优势。其一是前缀缓存优化——由于冻结的记忆内容不会随对话变化,LLM推理提供商可以对这部分内容进行KV缓存,显著降低Token成本和延迟。
其二是保证一致性——会话内不会出现记忆"变化"导致的上下文混乱。会话开始时,Agent看到的是记忆的"定格";会话中途无论怎么修改记忆,Agent在当前会话中都感知不到;新内容要等到下一个会话才能生效。
3. 外部记忆提供商
除了内置的文件记忆,Hermes 还支持 7 种外部记忆提供商:
Honcho组件:为每个用户建立专属的个人模型,记录其偏好、行为习惯、沟通方式与历史选择。通过实时分析对话与交互,Honcho 动态更新这些档案,从而让 Hermes 能够主动识别你的需求模式——例如你偏好的信息呈现方式、在相似任务中的决策倾向、高频执行的任务类型等,并在未来的交互中提前适应,让智能体更懂你,更自然地配合你的工作节奏。
Skills
技能系统可以说是Hermes与其他智能体最核心的区别所在。不同于OpenClaw、Claude Code等同类产品,它们的技能要么靠人工手动编写,要么需要人工主动调用工具来创建,一旦按照要求编写完成,就会固定不变,无法自主迭代。而Hermes是目前唯一内置学习循环的智能体,它不仅能自主创建技能,还能在实际使用过程中不断优化完善这些技能,更能在不同会话之间留存积累的知识,真正实现了“越用越聪明”。
支撑这一核心特性的,是Hermes“自进化+渐进加载”的核心运行机制,这也是它能高效运转的关键。
自我进化闭环更是Hermes与其他智能体最关键的差异点,整个闭环形成了完整的能力迭代链路:从执行任务开始,遇到错误或卡点后,它会主动反思问题根源,进而生成新的技能或优化已有技能,将优化后的技能妥善存储,等到下次遇到同类任务时,直接复用成熟技能,无需重复试错。
Hermes的自主技能创建并非无的放矢,而是有明确的触发条件,比如:当完成需要≥5次工具调用的复杂任务时,当从错误或死胡同中找到可行解法时,当用户修正操作后走通有效流程时,它都会自动生成标准的SKILL.md文件。
而渐进式加载则很好地解决了Token消耗过高的痛点,实现了高效与省Token的兼顾。它分为三个等级:Level 0阶段仅加载技能列表,仅消耗约3k Token,极大降低初始加载成本;Level 1阶段采用“用到才加载”的模式,只有当需要使用某个技能时,才会加载该技能的完整内容;Level 2阶段则更进一步,按需加载技能对应的子文件,比如脚本、参考资料等,避免了无用内容的加载,最大化节省Token资源。
除了强大的自进化能力,Skills Guard安全体系更是Hermes的一大亮点,堪称行业内最完善的技能安全防护机制,毕竟现在skills投毒的案例屡见不鲜,而Hermes针对性地搭建了全流程的安全防护体系。其中,五级信任分级是强制执行的核心安全策略,从高到低依次为:builtin(官方内置,完全信任,可放心使用)、official(Nous官方审核,高信任等级,安全性有强力保障)、verified(平台认证,中等信任,满足日常基础使用需求)、community(社区贡献,受限运行,避免潜在风险)、unscanned(未扫描,默认隔离禁用,从源头杜绝未知风险)。
与此同时,Hermes还搭建了全流程安全流水线,形成多维度防护:下载的技能会先放入隔离沙箱,不直接生效,避免恶意技能直接运行;通过静态扫描,全面检测技能中是否存在数据泄露、提示注入、破坏性命令、Shell注入等风险;支持可选的LLM审计功能,通过AI进行深度风险分析,进一步排查潜在隐患;全程日志留痕,audit.log文件会记录所有操作,做到每一步都可溯源,便于后续排查问题;还有权限锁机制,lock.json文件会详细记录技能的版本、哈希值、