标签

AI上班更累了:每天用的真实体感

发布时间:2026-05-03 03:14来源:微信阅读:7

我花了三个月搭好一套上下文管理系统——想办法怎么压缩对话、怎么分层调入记忆、怎么在有限窗口里塞下尽可能多的信息。结果Claude直接上了1M context版本,我那三个月的成果被一个版本号就“覆盖”了

1. 我说这不是单纯抱怨。那套方案当时确实解决了具体的痛点,只是它很难形成门槛。Karpathy在Sequoia Ascent 2026里讲过类似经历:他做过一个MenuGen App,从OCR识别菜单,到图像生成配图,再到渲染输出,完整流水线一条龙。但Gemini只用一句prompt就把这一切抹平了。他原话是:「我的整个MenuGen是多余的,它不应该存在」

2. 每次技术范式换代时,最容易踩的坑就是用新工具去提速旧范式。PC出现时大家想的是打字比手写快;互联网出现时大家想的是查资料比去图书馆快。方向没错,但关键判断往往不在这里。更重要的是:原来根本做不到的事,现在第一次变得可能了

3. Karpathy提到一个我觉得很“密”的观点:模型看起来的“蠢”,其实不是bug,而是一种商业层面的选择结果。为什么同一个模型能重构十万行代码库、能找出零日漏洞?因为它能用测试和reward signal不断被训练到极致。反过来,常识判断没有那么可验证的闭环,实验室也不会为了覆盖“50米外洗车店到底该走还是该开”去投入同等资源。训练代码能力更值钱,训练那种路线决策不值钱。他的比喻很到位:在数据分布里你在铁轨上疾驰,在分布外你挥刀闯进丛林

4. 这段解释对我每天的体感特别有用。我自己会写代码,也会让AI帮我做编程、跑数据、处理结构化任务——这些更像铁轨上的活,输出稳定,风险可控。但当事情需要行业经验做取舍,需要读懂人的具体场景,需要在模糊信息中拍板决策时,那就是丛林里的工作。模型可以给出十个听起来都合理的答案,每个都有理由,可你只要多追问一句,它们就经不起推敲

5. 但我觉得大多数人忽略了一个更大的点:AI不是让人更轻松,而是让我更累了。以前做“水活”——整理材料、排版文档、写初稿——确实无聊,可是中间总有喘息的间隙,脑子还能放空。现在这些步骤几乎都被AI接走了,真正留给你的,变成了需要你承担责任的判断。以前一天可能只做十个关键判断,现在可能要做四五十个。产出变多了,但认知负荷不降反升:大脑从“能歇一会儿”变成像CPU一样一直跑满

6. 我观察到大体可以分三类人。第一类是纯小白,啥都不懂,也没法判断,就直接全听AI的,所以反而不怎么累。第二类是特别强的人,往往一秒就能看出对错,AI在他手里只是杠杆,所以同样不累。第三类是介于两者之间的人:知识够用,知道需要判断,但判断过程很费劲——这群人最累

7. 为什么中间这类最累?Herbert Simon在1957年提出有限理性:人做决策并不是追求最优化,而是在认知资源受限的情况下“差不多就行”。AI并没有消除这个约束,只是把瓶颈推到了更上游。以前卡在信息不足,如今信息过剩,真正卡人的变成了判断力本身。你一天能输出多少个高质量判断,这个上限比以前更早被你触达

8. 对更junior的人来说,压力可能还更大。传统成长路径通常是手动做一遍——犯错——被前辈纠正——再慢慢积累pattern recognition。这个过程痛苦但有效,因为你会在错误里建立起“什么才算对”的内在标准。可如果一开始就让AI代劳,你就绕开了那一步,也绕开了完整反馈循环。等AI做出一个看似合理的错误,你往往分辨不出来,因为你从没亲手证明过“自己什么时候会做对”

9. Karpathy把这种差异概括为Vibe Coding和Agentic Engineering。Vibe Coding主要是抬高下限,让大多数人能用自然语言就驱动开发。Agentic Engineering则拉高上限:你要设计系统、拆解任务、验收结果,并在关键节点做判断。你的管理对象,是一群能力很强但偶尔也会“犯蠢”的实习生

10. 他还引过一句话:「你可以外包你的思考,但不能外包你的理解。」我自己的理解是:那些没法工程化的东西就不靠谱。因此我的应对并不是更快地把事交给AI,而是把judgment编码成规则——让AI在规则边界内工作,让规则可测试、可审计、可迭代。这听起来像工程化管理,而不是单纯的vibe coding

11. 也许真正该追问的不是“AI让什么更快了”,而是“AI让哪些东西不该存在了、哪些事情第一次变成可能了”。我那套context管理系统对应的是前者,被一次版本更新直接吃掉。但我多年积累下来的领域判断对应的是后者:你在一个行业扎得多深、见过多少人、踩过多少坑,这些模型替代不了。那些靠包装模型缺陷来赚钱的中间层,会随着模型进步一代消失一层。最后留下的,仍是你对问题本身的理解——这部分外包不了