如何解决AI上下文拥堵
E S S A Y
如何解决AI上下文拥堵
2026 · 05 · 24
与AI助手深入交流一段时间后,一个普遍的问题浮现:上下文窗口正变得越来越拥挤。
每一轮的对话、工具调用以及搜索结果都会被塞进上下文。随着时间推移,有效信息的比例不断下降。
经过我的测试——一个持续数小时的工作会话中,有效信息仅占40%左右。其余60%是工具定义、历史调用日志和过时的中间结果。AI需要消耗token来处理每条信息。
拥堵 = 高昂的成本。解决方案分为两个方向。
一、自动记忆衰减
信息不会直接删除,但会自动降温。四层文件存储:
hot/ — 过去 3 小时。完整对话,自动注入 session。
hot/ — 过去 3 小时。完整对话,自动注入 session。
warm/ — 3 小时到 7 天。原始记录,需用时检索。
warm/ — 3 小时到 7 天。原始记录,需用时检索。
gist/ — 7 到 14 天。压缩摘要,warm 保留原文。
gist/ — 7 到 14 天。压缩摘要,warm 保留原文。
forgotten/ — 14 天无检索则移入,30 天后删除。命中则重新升温。
forgotten/ — 14 天无检索则移入,30 天后删除。命中则重新升温。
由 organize.py 定时执行,Gateway插件在会话启动时自动注入 hot/ 层。被频繁检索的信息会自动晋升为永久记忆。
二、任务隔离
执行重任务时产生的大量中间过程也会污染上下文。解决办法是——不在主会话中执行重任务。
主会话使用 sessions_spawn 创建独立的子会话,指定 cleanup=delete。子会话完成后自动销毁,返回结果,不留中间过程的痕迹。
如果子会话中途崩溃,主会话通过 task.md 找到未完成的步骤,重新生成子会话从断点继续,信息零损耗。
如何复现
两套机制封装为两个ClawHub技能。将以下内容复制给你的AI助手:
请帮我从 ClawHub 安装 context-clear 和 claw-subagent-orchestrator 两个 skill。 在 openclaw.json 的 plugins.entries 里启用 context-clear 插件。 这个插件自带 before_prompt_build 钩子—— 每次对话开始时自动注入 hot/ 目录下 3 小时内的记忆作为上下文。 还自带 /refresh 命令用于一键整理。 添加一个 cron 任务,每天凌晨 3 点运行 skills/context-clear/plugin/scripts/organize.py。 完成后告诉我这套系统的完整说明。
请帮我从 ClawHub 安装 context-clear 和 claw-subagent-orchestrator 两个 skill。 在 openclaw.json 的 plugins.entries 里启用 context-clear 插件。 这个插件自带 before_prompt_build 钩子—— 每次对话开始时自动注入 hot/ 目录下 3 小时内的记忆作为上下文。 还自带 /refresh 命令用于一键整理。 添加一个 cron 任务,每天凌晨 3 点运行 skills/context-clear/plugin/scripts/organize.py。 完成后告诉我这套系统的完整说明。
AI将自动完成安装、配置和解释。
效果:主会话有效信息占比从40%提升至约75%,子会话隔离防止重任务抢占上下文,记忆衰减每月清理约60%的过时内容。
信息具有保质期——
好系统的区别不在于能记住多少,而在于知道该遗忘什么。
巡梦人
从一颗星星开始,温暖整个宇宙。