标签

AI 无法成为你的“实习生”

发布时间:2026-06-14 15:29阅读:1

我用 Codex 编写了一个自动填表程序。将一家三口的护照信息录入 Excel,使其自动识别字段并填充至申根签证表,仅需几秒钟,逐项核对后,零错误。

这正是 AI 最擅长的地方:处理那些重复、机械且无需任何判断的任务。

接着我让它处理签证照片——尺寸为 35×45mm,排版至 6 寸相纸以便打印。

初版尚可,我开始添加指令:强调尺寸、分辨率及裁切。结果第二版更差。持续修改后,它在比例、边距和像素之间反复横跳,就像一个被训斥得不知所措的人,每一次修改似乎都在重新理解,而非基于前一轮的进展。

许多人将此归咎于“AI 还不够智能”,但微软研究院和 Salesforce 去年发表的联合研究给出了另一种解释:测试 15 个主流模型,单轮完成率约为 90%,而拆分为多轮对话后平均降至 65%。更重要的是——一旦模型在某一轮偏离方向,无论你如何继续对话,都很难将其拉回正轨。

研究者为这一现象命名:迷失在对话里。

这就是“AI 实习生”这一比喻最大的误区。实习生犯错后,你指出问题,他会基于原有基础进行修改——从 80 分到 85 分再到 90 分,呈线性收敛,最终受限于其能力上限。AI 的工作方式并非如此。你以为是在给予反馈,其实它是在解一道越来越复杂的方程:变量越多,解越不稳定。你以为是在调教它,实际上它是在平衡所有历史指令的综合压力,每前进一步,都会对之前已稳定的部分造成扰动。

你给它增加一个约束,它就在其他地方松动一颗螺丝。

这里存在一个我们普遍相信的错觉:与 AI 互动越久,它就越懂你。这种直觉源于人类协作经验,合乎情理——但 AI 没有记忆,没有情绪,也没有“吸取教训”的机制。每一轮对话,它都在重新权衡,而非积累。

我们将“多轮对话”的体验解读为“协作关系”,但实际上它更像:每次你说一句话,它就重新洗一次牌。

因此,最常见的用法——“把任务丢给 AI,不断提出要求,直到满意”——恰恰是最低效的。

AI 擅长:有明确输入、固定规则且单轮可判断的任务。

AI 不适合:需要在反馈中持续校准、最终对齐一个模糊目标的过程。

后者,是专业人士花费数十年才掌握的技能。这并非因为难,而是因为其本质不是“执行”,而是“判断”——而判断,是从错误中生长出来的,而非从指令中读出来的。

最终我放弃了让 AI 处理签证照片,改为手动完成。

让 AI 快速带你从 0 到 80%,然后由你亲自接手。因为最后那 20%,不是靠增加一条指令就能解决的。

那 20%,是经验。