标签

AI写代码总出错?钱学森的控制论才是真解法

发布时间:2026-06-25 14:29阅读:2

最近AI编程工具火得不行。从Cursor刷屏,到上个月Claude Code的史诗级更新(当然还有7月8日后可能需身份验证,哈哈),行业里甚至冒出个新词叫“Vibe Coding”(氛围感编程)。

啥意思?就是开发者往椅子上一靠,跷着二郎腿,喝着咖啡,给AI丢几句模糊指令:“写个商城后台”、“修个Bug”。看着代码自动对齐,感觉自己像在指挥千军万马。

这种“氛围”确实爽。但爽完一上手复杂项目,十有八九就崩了:AI写的代码漏洞百出,一运行报错连篇;你让它改A,它把B全毁了;折腾半天,发现查Bug、补锅的时间,比自己手写还长。

这时,硅谷和国内技术圈悄悄流行起一种新观点:光琢磨Prompt已经到头了。想让AI真进项目组干活,你得懂一个新概念——Harness Engineering(安全带工程)。

今天学长不扯虚的,用最直白的话,拆透这个正成为高级AI工程师核心壁垒的Harness Engineering,到底是个啥。

聊Harness之前,先戳破一个幻觉。

不少科技博主天天吹:“大模型在进化,等GPT-6出来,AI就百分百可靠,翻车全解决。”

扯淡。只要你懂点大模型底层,就知道这纯属做梦。

就像图灵奖得主LeCun说的:LLM就算单个token正确率达99.999%,在几万步的工程链里,错误会指数级累积。从原理看,LLM本质就是个“概率预测机”,注定不靠谱。

那问题来了:AI不靠谱,人写代码也不绝对靠谱,俩不靠谱的凑一块,真就写不出靠谱系统?

其实能。这不是新玩意,而是我国科学巨匠钱学森几十年前提出的《工程控制论》。

工程控制论的核心很犀利:怎么用闭环反馈等机制,让一堆不可靠的部件,协同完成完美任务。

如今火起来的Harness Engineering,本质上就是这套理论在AI时代的落地。它不指望AI别犯错,而是默认它一定犯错,然后用刚性边界把它锁死。

过去一年多,我用Claude Code和Cursor带团队踩了无数坑。

最后得出一个扎心结论:90%的AI出错,不是模型笨,而是它根本不知道你想要啥。它看不到你眼里“理所当然”的潜规则。

举个真实案例:我让AI给FastAPI项目加字段校验。它写得语法无误、逻辑通顺,但我一看血压飙升——校验逻辑全塞进路由函数了。

我们团队规范:校验必须走独立validator层,才好维护。

我当时想砸键盘。但冷静一想:这规范写在哪?在我脑子里,在老员工的默契里。AI不是我肚子里的蛔虫,上下文里也没这段历史,它哪看得见?

OpenAI一个三人团队做过实验:花五个月手写代码,全交给Codex生成。他们第一条血泪经验就是:大模型看不见的东西,等于不存在。

过去新人入职,我们写Wiki、写onboarding文档。人类看不懂还能问一句;AI不会,它只会闷头乱写。

所以,Harness Engineering的第一步:让隐性知识显性化。

你得把脑子里的共识、团队的架构决策、设计记录(ADR),全写进代码仓库,变成AGENTS.md或Markdown文件。只要AI能实时读到,翻车率就能从90%暴跌到10%。

但光写文档就够?天真了。

很多人在Prompt或文档里写:“别改数据库Schema。”

这话有用吗?前几次有用。但上下文膨胀到十几万Token、对话拉到几十轮后,AI就会“注意力涣散”——技术圈叫“上下文腐烂”。你的叮嘱,它当耳旁风。

Harness Engineering和普通Prompt工程的本质区别:别劝了,直接拦。

Prompt Engineering:求你别改数据库。

Harness Engineering:我把规则写进CI、lint、pre-commit hook。

模型可以无视你的温柔提醒,但如果它敢乱动表结构,本地脚本立马抛“非零退出码”,强制终止提交。

这就是给AI拴上“缰绳”。我们把大任务拆成多个刚性、可自动验证的Harness Item(或称接受标准AC)。

数学上,我们要做的是:哪怕AI在某个子任务偷懒或写错(Reward Hacking),但因CI和测试卡在终点,让它通过的概率趋近于0,最终整体任务成功率趋近于1。

边界越清晰,验证越刚性,AI帮你搞定复杂任务的可能性就越高。

时代真变了。以前团队卷代码规范、算法优化;未来,随着AI越来越强,单个自动化验证(AC)粒度会更大,AI能吞下的任务也更宏大。

未来的高级工程师,核心竞争力不再是“手速快、代码标准”,而是“你能不能搭一套完美的Harness系统,去驯服和约束哪怕不完美的AI”。

这不只是写代码,这是用全新工程思维,重构人与AI的协作关系。

我是小张学长。今天内容有点硬核,但想在AI时代走得远,这才是必须啃透的底层逻辑。每天分享前沿技术与工程落地,关注别错过!