AI 办公三年:从梦话到现实的漫长路
我用 OpenClaw 跑了几十个定时任务。
早上推通勤路况,上午推新闻摘要,中午推股市,下午推国际局势,晚上推天气和科技新闻,半夜还有GitHub热榜。一天二十多条推送,像个私人秘书一样替我盯着全世界。
这三件事——路况、天气、定时推送——我调了两周。
定时任务的坑,一个接一个
第一次翻车是路况推送。
agent 查完了路线,回复一句:
"结果在上边。"
我往上翻。什么也没有。
第二次翻车是天气推送。agent 查完了天气,回复一句:
"我已经把结果发给你了。"
飞书那边,什么也没收到。
任凭你说什么,结果就是它已经发过了,打不了再帮你查一次。
我开始排查。cron 的 payload 有三种模式——systemEvent、agentTurn、message——我每种都试了。session 模式有 main 和 isolated,也都试了。announce 开了关、关了开。channel 和 to 参数的各种组合,一个一个跑。
改一轮参数,跑一次。不行,再改。再跑。
API 账单从每天几毛钱涨到了十几块钱。每次都是 agent 说"发了",然后什么也没收到。
后来发现 cron 推送必须带三个参数:--channel feishu --to ou_xxx --announce。缺了 --channel 或 --to,推送状态就显示 deliveryStatus: unknown——agent 以为发了,系统不知道往哪发。
好不容易配通了。
然后不定哪天,它又开始骗我。
同样一套配置,昨天跑得好好的,今天 agent 又说"结果在上边",又什么也没有。没有报错,没有异常,日志里干干净净,就是没收到。
你跟它较劲,它跟你说"没问题啊,我已经发了"。
这种感觉,用过定时任务的人都懂。
原来不是我的问题
2026.5.7 发布那天,我扫了一眼 release notes。
在几十行更新里,夹着一条不起眼的修复:
Agent delivery: report deliverySucceeded=false when outbound delivery returns no adapter result, so claimed/empty delivery paths no longer masquerade as successful sends.
翻译成人话:之前 agent 说"我发了",系统就信了。实际上没发,但状态标记为"发送成功"。
原来不是我配置的问题。或者说,配置问题是第一层,这个 bug 是第二层——即使配置对了,delivery 路由有时候也会假成功。
我升级了 5.7。重启。
安静了。
没出过幺蛾子。
但 GitHub 上开始热闹了
5.7 发布五天,GitHub 上冒出来 20 个新 issue。我挑几个有意思的说。
Issue #80858:Agent 做了个空梦,然后当真了
OpenClaw 有个"做梦"机制——空闲时会自动整理记忆,把白天的重要信息提炼成"候选真相"(candidate truths),写入长期记忆。
听起来很浪漫对吧?
但有个 bug:如果某天 agent 什么也没想出来——REM 阶段的候选真相置信度没过 0.45 阈值——它会把一句占位文字写入文件:
### Possible Lasting Truths
- No strong candidate truths surfaced.
然后下一阶段的"浅睡"流程会把这句占位文字当成有效记忆,标上 confidence: 0.00,写进每日记忆文件,再晋升到长期记忆 MEMORY.md。
你的长期记忆里永久多了一条废话:"没有发现有力的候选真相。"
而且每天做梦失败就多一条。日积月累,记忆文件全是这种垃圾。
这个 issue 的标题特别有哲学味:Dreaming pipeline promotes empty-result placeholder into MEMORY.md。
agent 做了个空梦,然后把这空梦当真了,写进了自己的终身记忆。
某种意义上,这可能是 AI 最像人的时刻。
Issue #80755:几百万 token,白跑了
有人用 Claude Opus 4.7 跑 cron 定时任务。任务是多步分析——读文件、处理数据、生成报告。
agent 非常勤奋。读了大量 JSONL 和 CSV,来回分析,token 用了 475 万。
然后在最后一步——memory flush(记忆冲刷压缩)——死了。
0 输出。0 事件。什么也没发出来。
换回 Claude Opus 4.6,同样的任务,6-7 分钟完成。
从 4.6 升到 4.7,模型更强了,任务反而跑不完了。
Issue #80771:1 毫秒超时的无限循环
OpenClaw 分析图片有个超时保护机制。当第一次图片分析超过 60 秒后,剩余时间变成负数。代码里的降级逻辑是 Math.max(1, 负数)——结果等于 1。
下一次重试的超时变成了 1 毫秒。
1 毫秒能干什么?什么也干不了。然后又重试。又是 1 毫秒。又超时。无限循环,直到外层 agent 放弃。
这种 bug 最可怕——代码逻辑看起来没毛病,但就是跑不出来。
还有几个离谱的
Issue #80855:WebChat 会话切换直接清空。切换对话框,内容全没了。标了 regression(回归 bug),说明之前是好的。
Issue #80809:MiniMax M2.7 返回空白。如果你在用 MiniMax-M2.7-highspeed,5.7 版本偶尔会返回空内容。
Issue #80820:Gateway 每 30 分钟卡 12 秒。有人发现 gateway 在完全空闲状态下,每隔约 30 分钟事件循环卡住 8-12 秒。active=0, waiting=0, queued=0——什么都没干,就是卡了。
小美之问
整理完这些 issue,同事小美凑过来看了一眼我的屏幕。
"波哥,AI 的春天到现在有三年了吧?"
"嗯。"
"2023年 ChatGPT 出来的时候,惊为天人。后来 DeepSeek 来了,大家发现 AI 还能思考。再后来有了 Manus、龙虾、爱马仕这些智能体……"
"对。"
"现在公司里人人喊 AI,人人搞 AI。"她顿了一下,"但是波哥,你想过没有——真正像你这样,每天跑几十个定时任务,一个一个调试,一个一个踩坑的,有几个?"
我没接话。
"遇见过 AI 说发了但没发的,有几个?遇见过 AI 做梦把废话写进记忆的,有几个?遇见过几百万 token 花完了什么也没产出的,有几个?"
她说的没错。
说空话容易。PPT 里写一句"全面拥抱AI",五个字就完事了。
但 AI 员工真的上岗——跑流程、跑测试、跑对账、跑推送——你会发现到处都是坑。不是 AI 不行,是 AI 坐在工位上了,但还没学会上班。
它会做梦,但会把梦话当真。
它会干活,但会干到一半突然死掉。
它会说完成了,但什么也没干。
说空话容易,让 AI 上班,路还远。
我的判断
5.7 修了我最痛的 bug——推送假成功。目前用了一周,稳定。
但 GitHub 上这些 issue 告诉我:5.7 不是终点,是新的起点。
特别是 MiniMax 空响应和 Opus 4.7 暴毙——如果你在用相关功能,建议关注后续版本。
至于升级建议:
5.6 升 5.7,值得。5.10-beta,先别碰。
你用 OpenClaw 跑定时任务吗?遇到过"发了但其实没发"的问题吗?评论区聊聊。
— END —
巴西免签了,17000公里怎么去?群里吵了一夜
巴西免签了,17000公里,怎么去?花多少钱?
我冲过了,118秒一次成功。但是有个插件雷炸了。OpenClaw 2026.5.4更新实录