拒绝AI"飘"忽:给助手建立一套"工厂环境"
你是否也曾遭遇过这种困境:
让AI撰写稿件,初稿尚可。你要求修改,它却越改越偏。你指出错误,它反而改得面目全非。几轮迭代后,你不得不亲自出马重写。
或者让其制定计划。结果它屡屡“失忆”——前次确立的定位,此刻却不承认;上一轮指令向东,这轮却转向西方。你自以为是在训练助手,实则沦为全职保姆。
症结究竟何在?
并非AI不够智能,而是其运行环境太过恶劣。
过去两年,我们耗费大量精力在“让AI表达更优美”——优化提示词、填充背景信息。这固然有效,却仅治标不治本。
打个比方:
提示词工程,犹如指导工人操作机床。指令越明确,操作越精准。但这仅能管控“这一刀的切法”。
上下文工程,宛如为工人配备图纸与说明书。它知晓零件规格与标准。但这仅能管控“这一批次的作业方式”。
然而真正的挑战在于:若要打造一个全天候运作的车间,面对人员轮换、设备故障、原料短缺,车间能否持续产出合格品?
此方法旨在解决上述难题——非追求工人技能精进,而是为其构建一套可持续运转的“工厂生态”。
有人称之为“环境工程”,名目非关键,核心在于思路:将AI视为工人,为其搭建车间、配置图纸、规范流程、设立质检。
图1:保障AI稳定输出的三层能力(由浅入深)
该方法的精髓在于四点,通俗来说:
试问哪家工厂是同一个人集设计、生产、质检于一身的?绝无可能。因若一人身兼数职,必会对产出过度自信——“我觉得很棒”。
AI亦然。若让同一AI既撰写方案又进行审核,它会愈发“自洽”——每审视一遍皆觉“无懈可击”,然旁人视之,尽是漏洞。
故首要原则:撰稿者不审核,审核者不修改。令不同AI角色各司其职,中间以“问题清单”进行交接。
操作简便——审核时,开启新对话窗口。
正如文章写毕,不亲阅,而是交由“未参与写作之人”挑刺。此人未受你思路“带偏”,故能洞察你未觉之谬误。
三种路径,由简至繁:
1最简:撰毕后,手动开启新窗口,粘贴内容,令AI充当“审核员”。
2进阶:借助AI工具(如Claude Code),可配置“自动开启新窗口审核”。
3专业:编写代码实现自动化,每次审核皆重新初始化。
图2:四大角色,各司其职
AI每次开工皆似“失忆”——不记前次所言、风格偏好、关注重点。需每次重申身份。
解决之道在于构建三层“档案库”:
1底层档案:身份、长期定位、产品版图——此为稳定的“人设”,变动甚微。
2中层档案:近期项目、当前重心——此为“工作面”,随项目推进更新。
3上层档案:未定草稿、待补素材——此为“半成品”,极不稳定。
最简方式即建三个文件夹:
AI每次开工前,先读取三层档案。即知身份、事由、何者可用、何者待定。
图3:三层档案库(重要性:底层 > 中层 > 上层)
工厂工人换班,非随意招呼即走。需留交接记录:进度、停顿、缘由、下步衔接。
AI亦然。每轮任务终了,必输出三样内容:
1计划单:本轮目标、后续路径。
2回执单:实际产出、停顿缘由。
3状态清单:当前进度、下一步入口。
📋 交接单 [公众号文章生产]
阶段:审核 → 修复 进度:60% 本轮完成:初稿撰写、独立审核 产出物:/桌面/公众号_xxx.html 阻塞点:审核发现3个阻断级问题 下轮入口:根据问题单修复B-001至B-003
如此,下一轮AI无需猜测“进度至何处”,可直接自交接点延续。
一篇佳作,非一蹴而就,多是“被逼”而出。
令独立AI角色审核,涵盖五重视角:
红队视角:若遭恶意攻击?(安全边界)
白队视角:技术可实施?(可行性)
小白视角:外人能懂?(易读性)
专家视角:有无更优解?(专业性)
用户视角:确为用户所需?(价值感)
审核非泛泛赞许,而是输出结构化“问题单”——何者有误、级别、整改方案。继而退回,令撰写角色逐条修正。
重要规则:修复超3次未果,即显式阻断,要求人工介入。
此乃防系统陷入无限自我改写——有时非AI所能修,乃方向初定即误,需人决断。
“阻断”意指:系统停摆,交问题予人。人可重定方向、降标放行或重写。系统不自决否定人工决策。
图4:对抗收敛流程(返修上限:3次)
非所有任务皆需如此繁复。先自查是否为目标用户:
此法将增加部分成本:
Token成本:多角色协作需多次调用LLM。一篇公众号文章从选题至发布,或耗5-10倍Token(对比单轮对话)。
时间成本:审核、返修、交接耗时。然高风险任务,此投入值——避“成稿方知路错”。
维护成本:三层Context库需持续维护。然此维护即知识沉淀,长远观之乃资产。
此乃本人实践:
场景:需公众号文章自动生成,将日常AI/产品/流程思考整理为可发布稿。
此前之弊:
令AI撰文,初稿尚可,改两轮即偏。不记风格、定位,屡屡失忆。终觉耗时多在“重释背景”与“纠偏”。
应用Harness后:
关键变革:
1建三层档案库,AI开工前先“读档案”
2撰稿与审核分离,审核开新窗口
3每次停工写交接单,下次直接续接
4返修超3次即阻断,由我决断是否降标
最重要的是:终可入睡时令AI继续作业。醒时见经研究、撰写、审核、修复后相对收敛之稿,而非需重释背景之半成品。
欲试此法,建议始于最简:
1建三文件夹:定位 / 项目 / 草稿箱。分置长期定位、当前工作、素材。
2审核开新窗口:下次AI撰毕,你开新窗口粘贴,令AI作“陌生人”挑刺。
3每次停笔写几句:进度、停因、下步。存“项目”文件夹。
1用支持“技能”的AI工具(如Claude Code),将“撰写”、“审核”、“交接”封装为固定流程。
2将档案库挂载至AI工具,使其自动读取定位与当前工作。
Q:此法与网上“思维链”等有何关联?
A:前者助AI“想得清晰”,此法助AI“干得稳定”。可叠加,不冲突。
Q:开新窗口审核,真有效?非同一AI乎?
A:有效。关键在“新窗口未阅前文”——仅见最终产出,不知构思过程。如陌生人阅文,比亲阅更易发现谬误。
Q:维护三层档案库是否繁琐?
A:底层中层本即工作产出(定位、项目文档),分门别类即可。上层即草稿箱。维护成本不高,收益显著。
· · ·
此非高深技术,乃“工程思维”——视AI为工,搭车间、配图纸、定流程、设质检。
你会发现,AI不再“飘忽”,不再“健忘”,不再“中断”。
其始似真助手,非需时刻紧盯之孩童。
核心原则唯一句:非令AI更聪,乃为其建稳定运转之环境。
· · ·