AI应用精选|AgentDoG 1.5轻量级智能体安全对齐方案 (1/20篇) · 5月30日
2026年05月30日星期六AgentDoG 1.5: A Lightweight and Scalable Alignment Framework for AI Agent Safety and Security🤗 81针对OpenClaw等开放世界智能体引发的全新安全挑战及现有对齐方案的缺陷,本文设计了一套轻量级且可扩展的智能体安全保障框架。我们对安全分类体系进行了更新以覆盖新出现的风险,并构建了以分类体系为指引、运用影响函数纯化的数据引擎,仅用约1k样本便训练出多个参数规模的AgentDoG 1.5
AI的记忆:ClaudeCode的实践与思考
ClaudeCode源码泄露,众人狂欢? 作为目前最流行的AI编程工具之一,它的源码可见后,很多人,包括我,去翻它的记忆机制,想看看Anthropic内部是怎么处理"AI失忆"这个问题的。 翻完之后会发现:它做了,但做得很克制,也很诚实。ClaudeCode的记忆方案核心是一个文件系统:CLAUDE.md。 项目根目录放一个CLAUDE.md,写项目级别的规则和约定。用户主目录再放一个全局的CLAUDE.md,写个人偏好。子目录里也可以放局部CLAUDE.md,处理特定模块的特殊要求。 每