AI 编程效率悖论:代码产出越快,返工为何越频繁?
「AI 研发流水线」系列连载 · 第 1 篇 / 共 4 篇 阅读时间约 6 分钟
周一上午 10 点,产品同事端着咖啡走过来:
"我们要做一个订单导出功能,你看一下,这周能上吗?"
你打开 Cursor / Claude Code,熟练地敲下:
"帮我实现订单导出功能。"
AI 飞快地生成了 300 行代码。前后端一把梭,看起来很完美。
然后,真实世界开始反击:
字段对不上 权限漏了 大数据导出超时 改完又破坏老功能 产品提一句需求 开发直接丢给 AI AI 生成大量代码 开始联调 出问题 回去问产品 让 AI 改 人工救火 继续救火
字段对不上
权限漏了
大数据导出超时
改完又破坏老功能
到了周三晚上,你盯着屏幕里第七版代码,得出一个反直觉的结论:
AI 写得越快,返工来得越早。
我观察过很多团队用 AI 写代码出问题的场景,根本原因都不是模型不行,而是:
我们让 AI 在缺少上下文、缺少边界、缺少验收标准的情况下直接开工。
一句"帮我实现订单导出"背后,其实暗藏着至少 8 个问题:
人类同事接到这种需求,会先回去问清楚再动手。AI 不会——它会立刻"热心"地帮你猜一个版本出来。
所以问题不在 AI,在我们的协作姿势。
把 AI 时代的软件开发想成一条流水线,而不是一个 prompt 框:
需求 Intake定义问题 Research调研证据 Requirements需求分析 MVP Design最小版本设计 Prompt Spec编码任务书 Plan First先计划 Code生成代码 Review对齐验收 Next MVP继续迭代
一句话概括这套流程:
AI 生成,人类决策,文档承载上下文,MVP 渐进交付。
关键不在于"多写文档",而是让每一步都有清晰的输入、输出和检查点。
很多人一上来就纠结"用 Cursor 还是 Claude Code,用 Gemini 还是 ChatGPT"。其实工具会变,角色不变:
🤖 AI 研发流水线 👤 人类 Reviewer Research Agent例: Gemini Deep Research Requirement Agent例: Claude Coding Agent例: Codex / Cursor Review Agent例: Claude / Codex 📁 docs/项目上下文与记录
关键原则:流程绑定的是职责,不是工具。
今天可以是 Gemini + Claude + Codex,明天工具变了,只替换角色,不推翻流程。
很多团队做流程失败,不是因为流程不对,而是一开始就做得太重。
我推荐从最小版本开始——一个需求对应一个目录,7 个文件:
整个工作流像这样串起来:
持续更新 持续更新 持续更新 00-intake.md定义问题 01-deep-research.md记录调研 02-requirements.md正式需求 03-mvp-1.mdMVP 范围与设计 04-mvp-1-prompt.md编码任务书 代码实现Plan + Code 05-mvp-1-review.md验收与复盘 open-questions.md未决问题
持续更新
持续更新
持续更新
如果觉得 7 个文件还是多,可以再浓缩成5 个 Gate,每个 Gate 只问几个问题:
Intake Gate问题清楚? Requirement Gate验收明确? MVP Gate范围够小? Plan Gate计划合理? Review Gate满足需求?
这两套东西其实是一回事:文件是产物,Gate 是检查点。它们已经足够防住绝大多数 AI 编码失控的问题。
回到开头那个周一上午的场景。如果当时不是直接丢给 AI,而是先花 20 分钟走完 Intake + Requirements,你大概率不会:
20 分钟换 2 天救火,这笔账划得来。
而且这 20 分钟里,AI 会替你做 80% 的工作——它帮你列方案、列风险、列验收标准。你只需要做决策。
光看流程图没用,接下来三篇我会用那个"订单导出"需求,带你完整走一遍这套流程:
📌 第 02 篇:从一句话需求到可执行 MVP
全程附上真实可复制的文档模板。
这套流程我已经在多个项目验证过,核心思想可以总结成一句话:
AI 时代,真正稀缺的不再是写代码的能力,而是组织上下文的能力。
接下来三篇会越来越具体、越来越能直接抄走用。
👉 关注我,不错过下一篇连载更新。
如果你也有"被 AI 加速返工"的经历,欢迎在评论区聊聊——你的踩坑可能就是下一篇的案例。
下一篇见:从一句话需求到可执行 MVP 👋