AI会执行,却不会判断
上周我让 AI 排查一个线上工单。权限给得很全,日志能看、数据库能连,它可以自己检索、自己分析。它翻了几遍日志,又查了一轮数据,代码位置定位得很准,分析过程也挺专业,可最后的结论还是错的。我还想着再补一些背景信息,毕竟它分析得有板有眼,感觉就差最后一步。
团队里一个做了五年的同事刚好路过,看了一眼工单说明,三秒钟:用户操作有问题。
不看日志,不跑数据。就是一眼看出来。你精心喂了半小时信息,还不如人家扫一眼来得准。
先说一个很多人都踩过的坑。
让 AI 帮你写 SQL,你复制到数据库里执行,报错了,再把错误信息贴回去。它问你表结构,你又去查,查完再贴过去。
来来回回几次,你就成了人工搬运信息的中转站。
信息在传递过程中会丢细节、会变形。AI 只能在你描述的局部事实里打转。闭环打通时,它能自己跑;闭环断开时,就像有脑子没手脚。
那闭环通了会怎样?OpenClaw 创始人 Peter Steinberger 的做法是:让 Agent 跑完整个循环,写代码、编译、测试、发现 bug、自动修复。他一天最多能提交 600 多次代码。不是他手速快,而是 AI 在自动完成闭环,人休息了机器还在继续跑。
编译器会告诉 AI 哪一行错了,测试会指出哪段逻辑不对。反馈足够明确、也足够及时,它就能一轮一轮迭代,直到改对。
AI 没用好,不是模型不够强,而是你没让它看到结果。
再回到开头那个工单。
闭环其实是通的。AI 能查日志、跑 SQL,也能看到完整数据。
可它就是判断不出来。你看着它条理清楚地给出一个错误答案,那种感觉确实有点怪。
为什么?“用户操作不当”这个结论,不是从数据里推出来的,而是从经验里长出来的。做了五年的人见过太多类似工单,脑子里已经压缩出一套模式,看到某些特征组合,直觉就会响。
这种直觉不在日志里,也不在数据库里。
写代码也是一样。前两天改一个接口报错,我一眼就知道该看哪个文件;换成 AI,它得地毯式搜索整个项目。你看着它一个一个翻,心里明明知道答案在哪,那个等待的过程还挺磨人。
人类专家凭直觉直接跳到关键位置,AI 只能靠穷举。
李想前两天说过一句话,挺准的:顶级专家用 Agent 的杠杆远高于普通人,AI 时代专业差距不是缩小,而是放大。AI 是放大器,不是均衡器。你有判断力,它能帮你加速十倍;你没有,它也变不出来。
用 AI 做事,最卡人的其实就两件事。
第一是闭环。能不能让 AI 自己跑通执行和反馈的循环?给它数据库权限、终端、测试框架,别让自己充当人肉中转站。
第二是直觉。能不能像老手那样一眼看出模式?说实话,我也没想到特别好的办法。总不能把五年经验直接塞进 Prompt 里。
闭环决定 AI 能不能跑起来,直觉决定它该往哪儿跑。
以前难在执行,现在难在判断。
所以现阶段最有效的方式就是:你来定方向,它去跑闭环。你提供直觉,它负责出力。
闭环越来越容易搭起来,但直觉只能靠你自己慢慢长出来。急不得,也省不了。如果你也在摸索 AI 怎么用,关注我,我们继续聊。