标签

这段时间使用AI的一些体会

发布时间:2026-04-04 19:32来源:微信阅读:6

这段时间体验下来的总体感受是:确实很实用,但远没有媒体渲染得那么神。

先简单说说我的配置:主用模型是GPT-4.5,主要配套工具也是他们家的codex(同名其实分两种产品,一种是客户端,一种是命令行版本,我平时更多使用命令行),订阅的是OpenAI每月20美元的套餐。

之所以选择他们家,过程多少有点曲折。我之前一直在用Gemini,但它家的命令行工具体验不够好,所以后来转向了很有名的Claude code。两家价格相同,而Claude在规划能力上更强,尤其在编程方面表现突出,算是公认的明星产品。

不过它家封号的情况比较多,尤其对中国用户似乎更敏感。网上甚至有种说法,说是因为创始人早年在百度实习时受过李厂长的气,所以迁怒到所有中国用户身上。(顺便一提,创始人Dario在美国硅谷也属于对华态度强硬的一派,一直支持限制高端芯片出口到中国。)

月初那阵子,我调用他们家的模型一直无法连接,我还以为自己账号被封了,便直接通过苹果申请了退款(我是通过App Store订阅的)。后来才知道并不是封号,而是他们在中东的服务器遭遇导弹袭击,所以才导致服务中断。

不过仔细想想,长期这样提心吊胆也没必要,于是我就干脆换到了OpenAI。再加上那段时间他们也刚推出codex,和Claude的cowork功能展开竞争(也就是AI能自动替你操作办公软件的能力),应付轻度工作已经足够,于是慢慢就把它当成了主力。

用到现在,我感觉自己已经进入了一个新阶段,因为它家的额度基本每周都能用满,多少有种把订阅费用回本了的感觉。

像我这种无业状态的人,平时其实没太多事情可做。往好听了说,是没有被AI替代工作的焦虑;往难听了说,就是能真正交给AI处理的场景也没那么多。

如果用更学术一点的话来概括,就是:我产生新想法的速度,赶不上AI进化的速度。我知道AI很强,但问题在于,我本身并没有那么多任务需要处理。

后来开始付费,也不是因为突然冒出了什么新点子,更多只是出于不想掉队的心态,先用起来再说。

最开始,我主要是让AI帮我做一些定时运行在服务器上的任务。比如定期查看社交媒体上我关注的人说了什么,又比如一些PE比价动作,以前这些都是我手动去看,现在基本交给服务器自动完成。

之后skills(技能)开始流行,我也写了一些技能,让它帮我处理固定的总结类工作。比如我有在notion上记日志和写总结的习惯,于是就做了几个skill,让AI读取我的日志内容,再自动生成周总结、月总结之类的东西。

再往后,openclaw开始流行起来,我也跟着用上了它,能做的操作就更复杂一些。比如让AI定期抓取数据,撰写一些基于数据的宏观分析报告,或者生成技术分析方面的总结。

到现在,只要我觉得某件事具有重复性,第一反应就是看能不能丢给AI。比如我最近在看水电股,需要跟踪水库数据,找到相关网址后,我就让AI每天帮我盯着,一旦有新数据就自动提取出来,再做同比变化并提醒我。

当然,AI也远不是时时刻刻都聪明。每个人大概都会踩到AI自己挖的坑,比如记忆问题(“我不记得我们之前聊过这个”)、偷懒问题(“我疏忽了”)、擅自发挥的问题(“我顺手还帮你改了……”)等等。有时候我真的觉得自己像是在带一个实习生。

有一次写报告时,我给了它一份非常详细的指引,包括去哪里取数据、优先级怎么排、每个栏目需要哪些信息、要采用什么样的表达方式,甚至还附上了一份完整的报告范例。

结果最终产出的内容,比我要求的要简略得多,各个模块都缺少数据项,反而最完整的部分是那些似是而非的分析,看得人非常烦躁。而这居然还是当时最先进的GPT5.4。

后来我又在提示词里补充了一些遗漏的信息,再跑了一遍,结果依然不太理想。

再后来,我干脆拿出了职场PUA那一套,要求它把我文档中的具体要求逐条贴出来,然后一项项对照,自行评分,看看离我的标准到底差了多少。这样折腾了一轮之后,效果才明显好了一些,接着继续慢慢调教,最后总算做出了一份比较像样的报告。

之后按照惯例,我又把打磨成熟的内容固化进skill文档里,本想着以后就能一路顺畅,让AI自己处理了。

结果到了下一次出报告,问题还是照旧,只不过形式上稍微换了点样子,用起来依然让人疲惫……

所以后来再看到那种“喂40万字就能自动长出一套交易框架”的说法,我基本都是一笑了之。这听起来就像是说让一个实习生读完30本名人著作,就能立刻变成交易高手一样,充满了电影式的浪漫幻想。

不过,实习生终究是会成长的,而AI的成长速度又远远快于人类,再叠加它惊人的成本优势(尤其是相对人工而言),每个人被这股浪潮裹挟着往前走,几乎是不可避免的。

一些比较实用的tips:

如果你不知道该拿AI做什么,不妨先想想自己每天重复三次以上的动作里,有哪些是可以交给AI的;

前期尽量多用plan mode模式。刚开始让AI做事时,我们脑子里的需求通常都是模糊的,而plan mode能提供一个讨论过程,通过不断追问,逼着我们把事情想得更清楚;但不要让AI替你做决定,关键问题还是得自己梳理、自己下结论,让AI负责执行就行;

要重视结构化文档的价值。要实现哪些功能、希望加什么限制、哪些事情不要做,写得越细,AI给出的结果通常就越好。而且正如前面说的,能写出来,本身就说明你已经想清楚了;

像memory.md、agents.md、user.md这类初始配置文件,也很值得自己动手改一改。这些背景信息会在每次对话中被加载,调整好之后能持续受益。如果看不懂英文,可以先让AI翻成中文再修改,实际效果并不会有区别;

如果你在用openclaw,最好额外写一个summarzie-memory的skill,强制AI把总结内容同步记录到当天的memory文件里,这样就不容易忘掉之前谈过什么(随着这两天openclaw版本更新,这方面似乎也在逐渐改善)。

模型质量真的非常重要,最低最低也得有智谱GLM-4.6这个水平。再往下当然不是完全不能用,只是特别容易把人折腾得很沮丧。既然我们都在被迫适应AI,不如尽量对自己好一点。

备注:封面和插图均由AI生成