AI科普:为何对话越久,AI显得越笨?
事情的经过是这样的。
不少朋友初次深度体验 AI 时,常会碰到一个令人费解的状况。起初交流时,它相当机智,响应迅速,也能精准领会你的意图。你叫它润色一段文字,它清楚你的诉求。你叫它梳理一份策划,它也能顺着你的逻辑延伸。
然而随着互动深入,感觉就不对了。
你明明先前否决了某个思路,它后续却又把该思路捡回来。你明明早已更换了标题,它却又围绕旧标题做文章。你叫它继续打磨稿件,它越改越像把此前的所有版本揉成了大杂烩。你批评它一句,它态度诚恳地认错。没过几个回合,它故态复萌。
此时许多人的直觉反应是,搞什么鬼,这 AI 怎么越聊越傻了。
实际上它未必是突然降智了。更普遍的情形是,你们这场对话的上下文已经被污染了。
封面图|AI 扫盲,为什么你跟 AI 越聊,它却越蠢?
不少人会误以为,上下文等同于 AI 的记忆。你同它交流越久,它就越了解你。你喂给它的信息越庞大,它就越聪慧。
这种认知有合理之处,但也暗藏风险。
上下文的确会左右 AI 的输出。你早期提供的素材、指令、基调、范例、禁忌,它在后续作答时均会予以考量。关键在于,这种考量绝非人类那种真正意义上的长效记忆。它更类似于你随手铺在桌面上的一沓文件。
这张桌面上有你的目标,有你的草案,有你刚才推翻的方案,有它自己输出过的旧草稿,有你追加的条件,也有一些彼时管用、此刻已然失效的资讯。只要这些内容依然留存于对话中,就有可能被 AI 捕捉到。
你可以设想一番,一个人挨着你坐协助你改稿。起初桌面空无一物,仅有一页任务单、一份初稿、几条修改意见,他自然容易做对。聊到最后,桌上堆满了废案、旧规划、临时灵感、被毙掉的标题、残缺的指令,他天资再高,也要耗费颇多精力去甄别哪一张才是当下该关注的。
AI 的上下文便等同于这张桌面。
它绝非一个自动归档的知识库。它仅仅是本次任务中,模型能够触及的一大片素材。素材越丰,不代表目标越明晰。素材越杂,反倒越容易误导它。
解释图|上下文像一张临时工作台,不是永久记忆仓库
人类之间交流,具备一项极强的默认本能。我们会自发分辨哪些话语已经失效,哪些要求已被替代,哪些不过是方才的随口之语。
譬如你对某位设计师讲,先尝试蓝色。片刻后你又改口,罢了,还是采用红黑配色。这位设计师多半明白蓝色方案已作废。他绝不会再每改一版都犹豫,蓝色是否还需保留。
AI 缺乏这般稳定的表现。
你早前定下的旧规矩,绝不因为你后续改变了主意就自动从上下文内抹除。它或许晓得你后来调整了方向,但旧信息依旧原封不动地摆在那。尤其当对话冗长、版本繁多、指令相互冲突之际,它就得在一堆信息中揣度,究竟哪一条才是此刻最核心的。
这便是许多人感觉 AI 越改越糟的根源。
你叫它撰写一篇文章,首回要求偏口语。次回要求偏学术。第三回要求别太科普风。第四回要求带点公众号味。第五回要求开头精简。第六回要求留住原有的情感。第七回又要求别太煽情。
每一项指令单看都没错。问题在于,它们汇聚一堂后,就不再是一套清晰的准则,而是一团相互牵扯的乱麻。
AI 最易犯的错,绝非全然无视你的话,而是对每句话都听从了一点。结局便是,它把你早抛弃的内容夹杂了一点回来,把你刚强调的重点做得不够纯粹,最终炮制出一个看似卖力、却方向诡异的缝合怪。
这不是它在刻意糊弄你。
而是你们的工作台实在太乱了。
解释图|旧要求、废稿和新目标混在一起,AI 就容易越改越糊
近年诸多模型都在拼长上下文。数十万 token,百万 token,听上去极具震撼力。许多人也会下意识地认定,上下文越长越佳。能喂进去的素材越海量,AI 就越强悍。
我认为对此需保持几分理智。
长上下文固然大有用处。你要提炼长文,审查合同,梳理一堆会议记录,处理庞大项目档案,缺乏长上下文确实举步维艰。它赋予了 AI 更广阔的视野,此项能力至关重要。
然则看得更多,未必判得更准。
这就好比把整个书架全搬至一人跟前。他确乎掌握了更多资料,但你并未指明当前任务究竟该看哪本、哪章、哪页,他反而更易被无关信息分心。资料越丰沛,杂音也越嘈杂。你不能把「能容纳」直接等同于「能领悟」。
长上下文真正适用的情境,是素材本身具备清晰架构,且任务目标足够聚焦。譬如你指示它,仅依据本合同排查风险条款。抑或,仅根据这三份会议纪要汇总待办。此时长上下文犹如一张巨桌,能铺开大量资料,十分好用。
可若你的任务本身不断摇摆,素材持续累加,旧指令迟迟不清理,长上下文恐将沦为更大的垃圾场。
桌面越宽敞,不代表台面越整洁。
此话实则颇为关键。多数人真正渴求的并非无限长的上下文,而是更纯粹的上下文。
解释图|桌子越大,不代表桌面越干净
那该如何应对呢。
我认为普通用户不必急于钻研分词器,也无需死记一堆技术名词。你仅牢记一条准则即可,别让 AI 负载着大量失效信息前行。
首要一点,是进行阶段性梳理。
当你与 AI 互动了诸多回合,尤其在撰文、拟案、改项目资料之时,别一味往下顺延。每隔一段时期,令它汇总一次当下定论。你可要求它仅保留已敲定的内容,将遭否决的思路、旧版本、临时探讨统统剔除。
此法极为奏效,当前敲定的结论是什么,哪些指令已然失效,后续仅基于此推进。
其次,是应当新建对话时果断新建。
不少人舍不得新建对话,觉着前期聊了那么多,舍弃太浪费。实则并非所有聊天记录都值得随身携带。你真正需带走的仅是结论,绝非整个历程。历程中充斥着大量废案、试探、反复与杂音。
新建对话之际,莫将旧聊天整段照搬进去。你只需带入三样事物,当前目标、必备素材、已敲定的准则。
第三点,是明晰告知 AI 哪些内容失效。
别光说「再调调」。你得直言,上一版标题方向作废,旧口号别再参照,后续仅保留此架构。AI 非人类同侪,它未必总能精准捕捉你的语气更迭。你表达越明晰,它越不易将旧物翻出。
第四点,是将大目标拆解为小目标。
别在单一对话内同时叫它定选题、起标题、撰全文、找配图、调排版、传草稿、查二维码。你固然能让 Agent 串联执行,但每个环节最好具备清晰的输入与输出。定标题即定标题,写正文即写正文,配图即配图,上传即上传。
任务拆解后,上下文亦会清爽许多。
方法图|清理上下文的四个动作,阶段总结、重开对话、声明作废、拆小任务
有时我觉得,大众对 AI 的误读,源于一种顺理成章的期许。他们巴望 AI 越聊越懂自己,最好犹如故交一般,往事全盘牢记,偏好悉数吸纳,项目皆能无缝衔接。
此般期许固然美妙。症结在于,眼下多数 AI 产品尚无这般顺滑。至少于实际工作内,你不可将全部指望押在一个无限拉长的聊天框上。
真正善用 AI 之人,往往并非最精于撰写 Prompt 者,亦非最擅长同 AI 闲聊者,而是最善于打理任务现场者。
他知晓何时该汇总。何时该截断。何时该新建对话。何时该将资料移至外部文档。何时该让 AI 仅聚焦当前任务所需的那几页,而非将整个项目沿革全背上。
此事听起来不够炫酷,却极其管用。
因为 AI 极像一位聪慧却无经验的实习生。你予它一张净桌,它能表现优异。你将半月的废纸、旧案、聊天记录、临时灵感尽数堆至其跟前,它哪怕再卖力,恐也将越做越糟。
故而日后你若再觉 AI 越聊越傻,不妨先别急于更换模型。你可先自问一句,此对话的上下文是否已脏了。
若是,便别继续硬撑了。
先理桌面。
收束图|真正会用 AI 的人,会整理任务现场,而不是无限延长聊天窗口
言及于此,实则便能引申出另一重疑问。
若聊天框不适宜一直拖着走,那长期项目该当如何。譬如一组公众号连载、一份客户企划、一个产品库、一个公司知识库、一项长期运营计划,总不至于回回皆从头交代。
此刻便不可单赖聊天记录了。你需借助外部的项目母档,需仰仗能被 AI 读取的资料库,需将素材、结论、版本、任务与标准沉淀下来。如此 AI 每次介入,便不是翻找一大坨聊天记录,而是调取当前任务切实所需之资料。
这也是我后来越发看重项目母档与 LLM WIKI 的缘由。非为彰显专业,而是聊天框委实不堪承载长期项目。
不过此点可留待下篇专文详述。
本篇你仅牢记一理便足。上下文绝非越长越妙,核心在于越净越好。AI 并非无力应对繁杂任务,但你得帮它把任务现场理清。
很多时候,AI 并非越聊越傻。
而是你们一同将桌子聊乱了。
以上,既然读至此处了,若觉尚可,顺手点个赞、在看、转发三连吧,若盼第一时间接收推送,也可赐个星标。多谢阅览,咱们,下回再会。
扫码关注公众号,上船去 AI 世界冒险吧