AI 编码再强,也跨不过这道坎
同事小王借助 Cursor 耗时三天搭建了一套系统,演示当日,老板发问:"若用户既申请退款又使用了优惠券,金额该如何核算?"小王:"……"系统运行虽流畅,业务逻辑却断了链。
2025 年,当 Andrej Karpathy 提出"Vibe Coding"概念时,众人尚且嗤之以鼻——不审查、不理解、直接接纳 AI 生成的代码?这难道不是偷懒吗?
一年光阴流转,如今却笑不出来了。
Claude Code 能生成具备完整异常处理的微服务调用,Codex 可驾驭复杂的状态机逻辑,Cursor 甚至能一次性修改十几个文件而井然有序。你曾言"AI 无法胜任复杂业务",此刻恐怕已难以启齿。
然而,有个场景每日都在上演:
产品经理吩咐"增加退款功能",AI 五分钟便产出代码,运行无误且界面美观。直至上线方知——部分退款如何处置?退款与优惠券的互斥规则为何?多次退款的幂等性何以保障?
代码本身无懈可击,症结在于问题本身从未被清晰界定。
这正是 AI 永远无法独自攻克的难题。
许多人的本能反应是防御:"AI 写不出安全代码"、"AI 搞不定并发"、"AI 处理不了复杂业务逻辑"。
时至 2026 年,这些 AI 皆可为之。若仍坚称"AI 做不到",只会显得你脱离现实。
真正的优势不在于"AI 不能做什么",而在于"AI 做任何事都需要你先做对什么"。
这两句话听似相近,逻辑却大相径庭:
产品经理称"加个退款功能"——这并非需求,仅是一句空话。
真正的需求定义需回答:
这些问题的答案,AI 一无所知,产品经理也语焉不详。唯有你将只言片语转化为可执行的规格,AI 方能输出正确的代码。
你投喂模糊,它便回报"貌似那么回事";你给予精确,它才回馈精准。
面对同样的需求,两类人使用 AI 的效果截然不同:
A:"写个退款接口" → AI 靠想象发挥,大概率偏离业务 B:提供详尽的业务规则、数据库表结构及上下游接口文档 → AI 生成的代码基本可直接复用
差距何在?非 AI 能力之别,实乃输入上下文质量之差。
高手与新人的分野,不在于工具迥异,而在于输入不同。AI 的上限,由你的输入质量所决定。
代码能跑通 ≠ 代码即正确。
AI 生成的代码常呈现"看似正确、运行无误、但语义偏差"的状态。
此类 Bug 未必能通过测试发现,因为测试基于你的预期编写,而你的预期或许与真实业务需求存在偏差。
验证绝非"跑一下看有无报错",而是"此段代码行为是否契合业务意图"。
尤需警惕 AI 的"合理却错误"——逻辑自洽、运行通畅,但语义与业务需求背道而驰。此类代码最易通过代码评审,因其表象着实合理。
AI 能罗列方案 A 与方案 B 的优劣,但最终拍板定案者是你。
AI 的建议具有通用性,你的决策则针对具体场景。在通用建议与具体情境之间,永远需要人类进行裁决。
AI 会告知"高并发场景需启用缓存",却不知你们团队的缓存曾引发两次线上事故,此次若用必须增设降级机制。
此项判断,唯你能做。
这一点日益关键,因 AI 编程并非免费午餐。
一次 Claude Code 的交互,或消耗 5 万至 20 万 Token。一个项目终结,Token 费用甚至可能超越工程师薪资。
成本控制能力涵盖:
非越廉越好,亦非越贵越佳,而是在成本与质量间寻求平衡点。
70% 的常规编码任务无需最强模型。简单补全选用小模型,复杂任务再动用大模型。整体 Token 成本可降低 60% 以上。
仅提供相关代码,切勿将整个项目全盘托出。修改用户模块时,无需将支付模块代码一并塞入。
Token 消耗可减少 3 至 5 倍,且 AI 生成质量反而更佳——无关信息剔除后,模型不易受干扰。
模糊的提示词 → AI 生成结果不符预期 → 修改提示词 → 重新生成 → 仍不对 → 再改……
一次性表述清晰,可直接省去 3 至 4 轮交互。
面对相似问题,勿让 AI 从零开始。维护一套代码模板,AI 仅需填充差异部分。配合 Prompt Caching,Token 消耗可降低 50% 以上。
并非所有任务皆适宜交由 AI 处理。
适宜 AI 的:重复性高、模式固定的代码;需快速探索多种方案的场景;不熟悉的语言或框架。
不宜 AI 的:改一行配置即可解决的小修小补;你已极度熟悉的代码区域;需深度理解业务上下文的决策型代码。
试举一例:线上报出 NullPointerException,查阅日志定位某行缺失空值判断。手动添加一行 if 判断,10 秒搞定。若交予 AI?读取报错、分析文件、推敲上下文、生成修复码、校验……至少耗费 10k Token,历时 3 分钟。
10 秒的手工活,演变为 3 分钟的 AI 交互,代价反而更高。
场景一:AI 编写的系统运行顺畅,但业务逻辑经不起推敲
AI 能编写代码,却无法替你理解业务。退款退回哪张卡、优惠券能否叠加、超时未支付是否自动关闭——这些规则 AI 不会主动询问,若不明说,代码必错。
场景二:AI 生成的代码"看似正确、运行无误、但语义偏差"
退款接口返回成功,实则退至错误账户。权限校验通过,却误用了角色。数据处理完毕,精度却丢失两位小数。
此类 Bug 测试未必能捕获。验证非"跑一下看有无报错",而是"此段代码行为是否契合业务意图"。
场景三:AI 束手无策时,你需具备修复能力
线上故障,求助 AI 却无果。或许因其对线上环境缺乏感知,亦或因问题根源涉及多模块交互,超出 AI 上下文窗口承载极限。
兜底之关键在于不可坐等 AI 救援,你必须能够接手:回滚、排查、修复、复盘。
AI 修不了时,你得能修。此为底线。
回归开篇的灵魂拷问:在 Vibe Coding 盛行、基座模型日益强大的今天,你认为自身优势何在?
答案是:AI 做任何事都需要你先做对——定义问题、构建上下文、验证结果、做出决策、控制成本。
非"AI 做不到",而是"AI 需要你"。
"AI 做不到"是防守,路越走越窄;"AI 需要你"是驱动,越用越强。
你的优势不在于写得比 AI 好,而在于让 AI 写得更好。