标签

AI 编码再强,也跨不过这道坎

发布时间:2026-05-13 05:53来源:微信阅读:7

同事小王借助 Cursor 耗时三天搭建了一套系统,演示当日,老板发问:"若用户既申请退款又使用了优惠券,金额该如何核算?"小王:"……"系统运行虽流畅,业务逻辑却断了链。

2025 年,当 Andrej Karpathy 提出"Vibe Coding"概念时,众人尚且嗤之以鼻——不审查、不理解、直接接纳 AI 生成的代码?这难道不是偷懒吗?

一年光阴流转,如今却笑不出来了。

Claude Code 能生成具备完整异常处理的微服务调用,Codex 可驾驭复杂的状态机逻辑,Cursor 甚至能一次性修改十几个文件而井然有序。你曾言"AI 无法胜任复杂业务",此刻恐怕已难以启齿。

然而,有个场景每日都在上演:

产品经理吩咐"增加退款功能",AI 五分钟便产出代码,运行无误且界面美观。直至上线方知——部分退款如何处置?退款与优惠券的互斥规则为何?多次退款的幂等性何以保障?

代码本身无懈可击,症结在于问题本身从未被清晰界定。

这正是 AI 永远无法独自攻克的难题。

许多人的本能反应是防御:"AI 写不出安全代码"、"AI 搞不定并发"、"AI 处理不了复杂业务逻辑"。

时至 2026 年,这些 AI 皆可为之。若仍坚称"AI 做不到",只会显得你脱离现实。

真正的优势不在于"AI 不能做什么",而在于"AI 做任何事都需要你先做对什么"。

这两句话听似相近,逻辑却大相径庭:

产品经理称"加个退款功能"——这并非需求,仅是一句空话。

真正的需求定义需回答:

这些问题的答案,AI 一无所知,产品经理也语焉不详。唯有你将只言片语转化为可执行的规格,AI 方能输出正确的代码。

你投喂模糊,它便回报"貌似那么回事";你给予精确,它才回馈精准。

面对同样的需求,两类人使用 AI 的效果截然不同:

A:"写个退款接口" → AI 靠想象发挥,大概率偏离业务 B:提供详尽的业务规则、数据库表结构及上下游接口文档 → AI 生成的代码基本可直接复用

差距何在?非 AI 能力之别,实乃输入上下文质量之差。

高手与新人的分野,不在于工具迥异,而在于输入不同。AI 的上限,由你的输入质量所决定。

代码能跑通 ≠ 代码即正确。

AI 生成的代码常呈现"看似正确、运行无误、但语义偏差"的状态。

此类 Bug 未必能通过测试发现,因为测试基于你的预期编写,而你的预期或许与真实业务需求存在偏差。

验证绝非"跑一下看有无报错",而是"此段代码行为是否契合业务意图"。

尤需警惕 AI 的"合理却错误"——逻辑自洽、运行通畅,但语义与业务需求背道而驰。此类代码最易通过代码评审,因其表象着实合理。

AI 能罗列方案 A 与方案 B 的优劣,但最终拍板定案者是你。

AI 的建议具有通用性,你的决策则针对具体场景。在通用建议与具体情境之间,永远需要人类进行裁决。

AI 会告知"高并发场景需启用缓存",却不知你们团队的缓存曾引发两次线上事故,此次若用必须增设降级机制。

此项判断,唯你能做。

这一点日益关键,因 AI 编程并非免费午餐。

一次 Claude Code 的交互,或消耗 5 万至 20 万 Token。一个项目终结,Token 费用甚至可能超越工程师薪资。

成本控制能力涵盖:

非越廉越好,亦非越贵越佳,而是在成本与质量间寻求平衡点。

70% 的常规编码任务无需最强模型。简单补全选用小模型,复杂任务再动用大模型。整体 Token 成本可降低 60% 以上。

仅提供相关代码,切勿将整个项目全盘托出。修改用户模块时,无需将支付模块代码一并塞入。

Token 消耗可减少 3 至 5 倍,且 AI 生成质量反而更佳——无关信息剔除后,模型不易受干扰。

模糊的提示词 → AI 生成结果不符预期 → 修改提示词 → 重新生成 → 仍不对 → 再改……

一次性表述清晰,可直接省去 3 至 4 轮交互。

面对相似问题,勿让 AI 从零开始。维护一套代码模板,AI 仅需填充差异部分。配合 Prompt Caching,Token 消耗可降低 50% 以上。

并非所有任务皆适宜交由 AI 处理。

适宜 AI 的:重复性高、模式固定的代码;需快速探索多种方案的场景;不熟悉的语言或框架。

不宜 AI 的:改一行配置即可解决的小修小补;你已极度熟悉的代码区域;需深度理解业务上下文的决策型代码。

试举一例:线上报出 NullPointerException,查阅日志定位某行缺失空值判断。手动添加一行 if 判断,10 秒搞定。若交予 AI?读取报错、分析文件、推敲上下文、生成修复码、校验……至少耗费 10k Token,历时 3 分钟。

10 秒的手工活,演变为 3 分钟的 AI 交互,代价反而更高。

场景一:AI 编写的系统运行顺畅,但业务逻辑经不起推敲

AI 能编写代码,却无法替你理解业务。退款退回哪张卡、优惠券能否叠加、超时未支付是否自动关闭——这些规则 AI 不会主动询问,若不明说,代码必错。

场景二:AI 生成的代码"看似正确、运行无误、但语义偏差"

退款接口返回成功,实则退至错误账户。权限校验通过,却误用了角色。数据处理完毕,精度却丢失两位小数。

此类 Bug 测试未必能捕获。验证非"跑一下看有无报错",而是"此段代码行为是否契合业务意图"。

场景三:AI 束手无策时,你需具备修复能力

线上故障,求助 AI 却无果。或许因其对线上环境缺乏感知,亦或因问题根源涉及多模块交互,超出 AI 上下文窗口承载极限。

兜底之关键在于不可坐等 AI 救援,你必须能够接手:回滚、排查、修复、复盘。

AI 修不了时,你得能修。此为底线。

回归开篇的灵魂拷问:在 Vibe Coding 盛行、基座模型日益强大的今天,你认为自身优势何在?

答案是:AI 做任何事都需要你先做对——定义问题、构建上下文、验证结果、做出决策、控制成本。

非"AI 做不到",而是"AI 需要你"。

"AI 做不到"是防守,路越走越窄;"AI 需要你"是驱动,越用越强。

你的优势不在于写得比 AI 好,而在于让 AI 写得更好。