标签

AI 办公三年:从梦话到现实的漫长路

发布时间:2026-05-12 12:56来源:微信阅读:7

我用 OpenClaw 跑了几十个定时任务。

早上推通勤路况,上午推新闻摘要,中午推股市,下午推国际局势,晚上推天气和科技新闻,半夜还有GitHub热榜。一天二十多条推送,像个私人秘书一样替我盯着全世界。

这三件事——路况、天气、定时推送——我调了两周。

定时任务的坑,一个接一个

第一次翻车是路况推送。

agent 查完了路线,回复一句:

"结果在上边。"

我往上翻。什么也没有。

第二次翻车是天气推送。agent 查完了天气,回复一句:

"我已经把结果发给你了。"

飞书那边,什么也没收到。

任凭你说什么,结果就是它已经发过了,打不了再帮你查一次。

我开始排查。cron 的 payload 有三种模式——systemEvent、agentTurn、message——我每种都试了。session 模式有 main 和 isolated,也都试了。announce 开了关、关了开。channel 和 to 参数的各种组合,一个一个跑。

改一轮参数,跑一次。不行,再改。再跑。

API 账单从每天几毛钱涨到了十几块钱。每次都是 agent 说"发了",然后什么也没收到。

后来发现 cron 推送必须带三个参数:--channel feishu --to ou_xxx --announce。缺了 --channel 或 --to,推送状态就显示 deliveryStatus: unknown——agent 以为发了,系统不知道往哪发。

好不容易配通了。

然后不定哪天,它又开始骗我。

同样一套配置,昨天跑得好好的,今天 agent 又说"结果在上边",又什么也没有。没有报错,没有异常,日志里干干净净,就是没收到。

你跟它较劲,它跟你说"没问题啊,我已经发了"。

这种感觉,用过定时任务的人都懂。

原来不是我的问题

2026.5.7 发布那天,我扫了一眼 release notes。

在几十行更新里,夹着一条不起眼的修复:

Agent delivery: report deliverySucceeded=false when outbound delivery returns no adapter result, so claimed/empty delivery paths no longer masquerade as successful sends.

翻译成人话:之前 agent 说"我发了",系统就信了。实际上没发,但状态标记为"发送成功"。

原来不是我配置的问题。或者说,配置问题是第一层,这个 bug 是第二层——即使配置对了,delivery 路由有时候也会假成功。

我升级了 5.7。重启。

安静了。

没出过幺蛾子。

但 GitHub 上开始热闹了

5.7 发布五天,GitHub 上冒出来 20 个新 issue。我挑几个有意思的说。

Issue #80858:Agent 做了个空梦,然后当真了

OpenClaw 有个"做梦"机制——空闲时会自动整理记忆,把白天的重要信息提炼成"候选真相"(candidate truths),写入长期记忆。

听起来很浪漫对吧?

但有个 bug:如果某天 agent 什么也没想出来——REM 阶段的候选真相置信度没过 0.45 阈值——它会把一句占位文字写入文件:

### Possible Lasting Truths

- No strong candidate truths surfaced.

然后下一阶段的"浅睡"流程会把这句占位文字当成有效记忆,标上 confidence: 0.00,写进每日记忆文件,再晋升到长期记忆 MEMORY.md。

你的长期记忆里永久多了一条废话:"没有发现有力的候选真相。"

而且每天做梦失败就多一条。日积月累,记忆文件全是这种垃圾。

这个 issue 的标题特别有哲学味:Dreaming pipeline promotes empty-result placeholder into MEMORY.md。

agent 做了个空梦,然后把这空梦当真了,写进了自己的终身记忆。

某种意义上,这可能是 AI 最像人的时刻。

Issue #80755:几百万 token,白跑了

有人用 Claude Opus 4.7 跑 cron 定时任务。任务是多步分析——读文件、处理数据、生成报告。

agent 非常勤奋。读了大量 JSONL 和 CSV,来回分析,token 用了 475 万。

然后在最后一步——memory flush(记忆冲刷压缩)——死了。

0 输出。0 事件。什么也没发出来。

换回 Claude Opus 4.6,同样的任务,6-7 分钟完成。

从 4.6 升到 4.7,模型更强了,任务反而跑不完了。

Issue #80771:1 毫秒超时的无限循环

OpenClaw 分析图片有个超时保护机制。当第一次图片分析超过 60 秒后,剩余时间变成负数。代码里的降级逻辑是 Math.max(1, 负数)——结果等于 1。

下一次重试的超时变成了 1 毫秒。

1 毫秒能干什么?什么也干不了。然后又重试。又是 1 毫秒。又超时。无限循环,直到外层 agent 放弃。

这种 bug 最可怕——代码逻辑看起来没毛病,但就是跑不出来。

还有几个离谱的

Issue #80855:WebChat 会话切换直接清空。切换对话框,内容全没了。标了 regression(回归 bug),说明之前是好的。

Issue #80809:MiniMax M2.7 返回空白。如果你在用 MiniMax-M2.7-highspeed,5.7 版本偶尔会返回空内容。

Issue #80820:Gateway 每 30 分钟卡 12 秒。有人发现 gateway 在完全空闲状态下,每隔约 30 分钟事件循环卡住 8-12 秒。active=0, waiting=0, queued=0——什么都没干,就是卡了。

小美之问

整理完这些 issue,同事小美凑过来看了一眼我的屏幕。

"波哥,AI 的春天到现在有三年了吧?"

"嗯。"

"2023年 ChatGPT 出来的时候,惊为天人。后来 DeepSeek 来了,大家发现 AI 还能思考。再后来有了 Manus、龙虾、爱马仕这些智能体……"

"对。"

"现在公司里人人喊 AI,人人搞 AI。"她顿了一下,"但是波哥,你想过没有——真正像你这样,每天跑几十个定时任务,一个一个调试,一个一个踩坑的,有几个?"

我没接话。

"遇见过 AI 说发了但没发的,有几个?遇见过 AI 做梦把废话写进记忆的,有几个?遇见过几百万 token 花完了什么也没产出的,有几个?"

她说的没错。

说空话容易。PPT 里写一句"全面拥抱AI",五个字就完事了。

但 AI 员工真的上岗——跑流程、跑测试、跑对账、跑推送——你会发现到处都是坑。不是 AI 不行,是 AI 坐在工位上了,但还没学会上班。

它会做梦,但会把梦话当真。

它会干活,但会干到一半突然死掉。

它会说完成了,但什么也没干。

说空话容易,让 AI 上班,路还远。

我的判断

5.7 修了我最痛的 bug——推送假成功。目前用了一周,稳定。

但 GitHub 上这些 issue 告诉我:5.7 不是终点,是新的起点。

特别是 MiniMax 空响应和 Opus 4.7 暴毙——如果你在用相关功能,建议关注后续版本。

至于升级建议:

5.6 升 5.7,值得。5.10-beta,先别碰。

你用 OpenClaw 跑定时任务吗?遇到过"发了但其实没发"的问题吗?评论区聊聊。

— END —

巴西免签了,17000公里怎么去?群里吵了一夜

巴西免签了,17000公里,怎么去?花多少钱?

我冲过了,118秒一次成功。但是有个插件雷炸了。OpenClaw 2026.5.4更新实录