AI写代码总出错?钱学森的控制论才是真解法
最近AI编程工具火得不行。从Cursor刷屏,到上个月Claude Code的史诗级更新(当然还有7月8日后可能需身份验证,哈哈),行业里甚至冒出个新词叫“Vibe Coding”(氛围感编程)。
啥意思?就是开发者往椅子上一靠,跷着二郎腿,喝着咖啡,给AI丢几句模糊指令:“写个商城后台”、“修个Bug”。看着代码自动对齐,感觉自己像在指挥千军万马。
这种“氛围”确实爽。但爽完一上手复杂项目,十有八九就崩了:AI写的代码漏洞百出,一运行报错连篇;你让它改A,它把B全毁了;折腾半天,发现查Bug、补锅的时间,比自己手写还长。
这时,硅谷和国内技术圈悄悄流行起一种新观点:光琢磨Prompt已经到头了。想让AI真进项目组干活,你得懂一个新概念——Harness Engineering(安全带工程)。
今天学长不扯虚的,用最直白的话,拆透这个正成为高级AI工程师核心壁垒的Harness Engineering,到底是个啥。
聊Harness之前,先戳破一个幻觉。
不少科技博主天天吹:“大模型在进化,等GPT-6出来,AI就百分百可靠,翻车全解决。”
扯淡。只要你懂点大模型底层,就知道这纯属做梦。
就像图灵奖得主LeCun说的:LLM就算单个token正确率达99.999%,在几万步的工程链里,错误会指数级累积。从原理看,LLM本质就是个“概率预测机”,注定不靠谱。
那问题来了:AI不靠谱,人写代码也不绝对靠谱,俩不靠谱的凑一块,真就写不出靠谱系统?
其实能。这不是新玩意,而是我国科学巨匠钱学森几十年前提出的《工程控制论》。
工程控制论的核心很犀利:怎么用闭环反馈等机制,让一堆不可靠的部件,协同完成完美任务。
如今火起来的Harness Engineering,本质上就是这套理论在AI时代的落地。它不指望AI别犯错,而是默认它一定犯错,然后用刚性边界把它锁死。
过去一年多,我用Claude Code和Cursor带团队踩了无数坑。
最后得出一个扎心结论:90%的AI出错,不是模型笨,而是它根本不知道你想要啥。它看不到你眼里“理所当然”的潜规则。
举个真实案例:我让AI给FastAPI项目加字段校验。它写得语法无误、逻辑通顺,但我一看血压飙升——校验逻辑全塞进路由函数了。
我们团队规范:校验必须走独立validator层,才好维护。
我当时想砸键盘。但冷静一想:这规范写在哪?在我脑子里,在老员工的默契里。AI不是我肚子里的蛔虫,上下文里也没这段历史,它哪看得见?
OpenAI一个三人团队做过实验:花五个月手写代码,全交给Codex生成。他们第一条血泪经验就是:大模型看不见的东西,等于不存在。
过去新人入职,我们写Wiki、写onboarding文档。人类看不懂还能问一句;AI不会,它只会闷头乱写。
所以,Harness Engineering的第一步:让隐性知识显性化。
你得把脑子里的共识、团队的架构决策、设计记录(ADR),全写进代码仓库,变成AGENTS.md或Markdown文件。只要AI能实时读到,翻车率就能从90%暴跌到10%。
但光写文档就够?天真了。
很多人在Prompt或文档里写:“别改数据库Schema。”
这话有用吗?前几次有用。但上下文膨胀到十几万Token、对话拉到几十轮后,AI就会“注意力涣散”——技术圈叫“上下文腐烂”。你的叮嘱,它当耳旁风。
Harness Engineering和普通Prompt工程的本质区别:别劝了,直接拦。
Prompt Engineering:求你别改数据库。
Harness Engineering:我把规则写进CI、lint、pre-commit hook。
模型可以无视你的温柔提醒,但如果它敢乱动表结构,本地脚本立马抛“非零退出码”,强制终止提交。
这就是给AI拴上“缰绳”。我们把大任务拆成多个刚性、可自动验证的Harness Item(或称接受标准AC)。
数学上,我们要做的是:哪怕AI在某个子任务偷懒或写错(Reward Hacking),但因CI和测试卡在终点,让它通过的概率趋近于0,最终整体任务成功率趋近于1。
边界越清晰,验证越刚性,AI帮你搞定复杂任务的可能性就越高。
时代真变了。以前团队卷代码规范、算法优化;未来,随着AI越来越强,单个自动化验证(AC)粒度会更大,AI能吞下的任务也更宏大。
未来的高级工程师,核心竞争力不再是“手速快、代码标准”,而是“你能不能搭一套完美的Harness系统,去驯服和约束哪怕不完美的AI”。
这不只是写代码,这是用全新工程思维,重构人与AI的协作关系。
我是小张学长。今天内容有点硬核,但想在AI时代走得远,这才是必须啃透的底层逻辑。每天分享前沿技术与工程落地,关注别错过!