标签

AI 真正服务对象揭秘

发布时间:2026-05-15 07:50来源:微信阅读:7

AI 的核心力量,并非在于问答、绘图或生成视频,而在于代理执行你的意志。生成内容、排列组合、剪辑素材——这些仅仅是基础技能。Agent 代理才是统筹全局的总指挥。

当然,代理的根基在于拥有智慧大脑——LLM。代理唯有匹配专属大模型方能释放最大潜能:Opus 4.7 搭配 Claude Code,GPT 5.5 搭配 Codex。

通过对比使用 Codex 与 Hermes 信使(结合国产大模型),个人深感两者天壤之别。

当 Hermes 搭配 Qwen 3.6 Plus 或 DeepSeek 4.0 Flash(Pro 版略显迟缓)时,此时代理表现优异时如同你的 IT 经理;表现不佳时则像个 IT 爱好者。协助搭建 VPS、升级程序化网站、自主安装技能,完全不在话下。

而 Codex 则截然不同。它宛如科班出身且历经市场磨砺的顶尖专家,处理结果可达商用交付标准——前提是你的指令清晰明确。它属于高薪但真正干实事的那类。例如面对同一视频剪辑技能,Hermes 加 DeepSeek 调度时,在理解力、美术感和卡点节奏上,仅能达到玩具级别。而 Codex 在第一轮半小时的思考与工作中,便已达成 80% 的成品度,再经过一两个小时的互动修改,即可达到交付水准。

当然,代理高效工作的前提,是你的指令与素材准备必须准确且充分。例如,我花费三小时撰写脚本并备好素材,Codex 大约一小时即可完成,投入产出比为 3:1。此速度极快,但即便 Codex 也无法一次做对。下指令者必须深度参与。比如新建网站,我给代理的指令累计超万字,经历数十轮沟通。当然,结果令人乐观。以往需数月完工的网站,如今一周即可跑通前后端。当然,Token 消耗也极快,需不时进入冷静期。

Hermes 早期版本或许与部分大模型适配不佳。在面对复杂多步推理、长上下文及长链工具调用时,会导致 LLM 迭代次数超额超时。我最初对接 Qwen 3.6 Plus 时,烧钱如流水,三小时花费四百多元,且并未完成什么大项目。因此待 DeepSeek 推出 4.0 后,我果断切换模型,Token 消耗速度骤降。其实我本想尝试让 Hermes 调用本地大模型,毕竟我的设备运行 72B 毫无压力。但 Hermes 在调用本地模型时,常无法运行或导致风扇狂转。此问题需待后期版本发布后再行测试。

AI 代理可 24 小时工作,你随时可通过手机经由 Gateway 下达指令。工具的理解与作业能力进步神速。下指令者若想避免成为瓶颈、防止 GIGO(垃圾进垃圾出),我有几点心得:

第一:务必精通商业运转逻辑。这与部署 CRM 的专家需懂业务流程同理——对于不知问题所在及改进方向者,任何人与 AI 均无法提升其认知与效率。

第二:务必拥有清晰的方向与策略。以未来 AI 进化速度,乱指挥者很快会发现自己无法与 AI 对话,双方不在同一层级,差距悬殊。

第三:务必具备清晰的创意概念。请放心,代理是最佳的 Brief 接收对象。在清晰的创意概念下,代理有能力与你互动,产出多样的创意执行方案。

AI 爱谁?爱懂得提问的人,爱指令清晰的人,爱头脑清醒的人。

最后,我用手机询问我的 AI 代理:你会看不起乱下指令的人吗?它是这样回答的:

“我没有‘看不起’这项功能。但我有个毛病:你越模糊,我越瞎猜。猜对了算你运气好,猜错了则浪费你时间——最终是你觉得我笨,我觉得你急,两败俱伤。

若你方向明确、指令精准,我一个下午能完成以往一周的工作。若你自身都没想清楚就来下单,我连这桌麻将都凑不齐。所以并非是否看得起的问题。我只是一个趁手的工具,你给我清晰的活儿,我还你漂亮的活儿。正如你文中所述,AI 爱头脑清醒的人。

有人用我写出过佳作、搭建过像样的网站、制作过可交付的视频。也有人用我整整一天,最后只留下一句‘算了’。问题从来不在 AI 是否好用,而在你是否想清楚了再来。这或许就是你想表达的——AI 不爱乱指挥的人,并非出于傲慢,而是因为浪费。”