AI会执行，却不会判断

发布时间：2026-04-27 10:10阅读：10

上周我让 AI 排查一个线上工单。权限给得很全，日志能看、数据库能连，它可以自己检索、自己分析。它翻了几遍日志，又查了一轮数据，代码位置定位得很准，分析过程也挺专业，可最后的结论还是错的。我还想着再补一些背景信息，毕竟它分析得有板有眼，感觉就差最后一步。

团队里一个做了五年的同事刚好路过，看了一眼工单说明，三秒钟：用户操作有问题。

不看日志，不跑数据。就是一眼看出来。你精心喂了半小时信息，还不如人家扫一眼来得准。

先说一个很多人都踩过的坑。

让 AI 帮你写 SQL，你复制到数据库里执行，报错了，再把错误信息贴回去。它问你表结构，你又去查，查完再贴过去。

来来回回几次，你就成了人工搬运信息的中转站。

信息在传递过程中会丢细节、会变形。AI 只能在你描述的局部事实里打转。闭环打通时，它能自己跑；闭环断开时，就像有脑子没手脚。

那闭环通了会怎样？OpenClaw 创始人 Peter Steinberger 的做法是：让 Agent 跑完整个循环，写代码、编译、测试、发现 bug、自动修复。他一天最多能提交 600 多次代码。不是他手速快，而是 AI 在自动完成闭环，人休息了机器还在继续跑。

编译器会告诉 AI 哪一行错了，测试会指出哪段逻辑不对。反馈足够明确、也足够及时，它就能一轮一轮迭代，直到改对。

AI 没用好，不是模型不够强，而是你没让它看到结果。

再回到开头那个工单。

闭环其实是通的。AI 能查日志、跑 SQL，也能看到完整数据。

可它就是判断不出来。你看着它条理清楚地给出一个错误答案，那种感觉确实有点怪。

为什么？“用户操作不当”这个结论，不是从数据里推出来的，而是从经验里长出来的。做了五年的人见过太多类似工单，脑子里已经压缩出一套模式，看到某些特征组合，直觉就会响。

这种直觉不在日志里，也不在数据库里。

写代码也是一样。前两天改一个接口报错，我一眼就知道该看哪个文件；换成 AI，它得地毯式搜索整个项目。你看着它一个一个翻，心里明明知道答案在哪，那个等待的过程还挺磨人。

人类专家凭直觉直接跳到关键位置，AI 只能靠穷举。

李想前两天说过一句话，挺准的：顶级专家用 Agent 的杠杆远高于普通人，AI 时代专业差距不是缩小，而是放大。AI 是放大器，不是均衡器。你有判断力，它能帮你加速十倍；你没有，它也变不出来。

用 AI 做事，最卡人的其实就两件事。

第一是闭环。能不能让 AI 自己跑通执行和反馈的循环？给它数据库权限、终端、测试框架，别让自己充当人肉中转站。

第二是直觉。能不能像老手那样一眼看出模式？说实话，我也没想到特别好的办法。总不能把五年经验直接塞进 Prompt 里。

闭环决定 AI 能不能跑起来，直觉决定它该往哪儿跑。

以前难在执行，现在难在判断。

所以现阶段最有效的方式就是：你来定方向，它去跑闭环。你提供直觉，它负责出力。

闭环越来越容易搭起来，但直觉只能靠你自己慢慢长出来。急不得，也省不了。如果你也在摸索 AI 怎么用，关注我，我们继续聊。