AI 真正服务对象揭秘

发布时间：2026-05-15 07:50阅读：13

AI 的核心力量，并非在于问答、绘图或生成视频，而在于代理执行你的意志。生成内容、排列组合、剪辑素材——这些仅仅是基础技能。Agent 代理才是统筹全局的总指挥。

当然，代理的根基在于拥有智慧大脑——LLM。代理唯有匹配专属大模型方能释放最大潜能：Opus 4.7 搭配 Claude Code，GPT 5.5 搭配 Codex。

通过对比使用 Codex 与 Hermes 信使（结合国产大模型），个人深感两者天壤之别。

当 Hermes 搭配 Qwen 3.6 Plus 或 DeepSeek 4.0 Flash（Pro 版略显迟缓）时，此时代理表现优异时如同你的 IT 经理；表现不佳时则像个 IT 爱好者。协助搭建 VPS、升级程序化网站、自主安装技能，完全不在话下。

而 Codex 则截然不同。它宛如科班出身且历经市场磨砺的顶尖专家，处理结果可达商用交付标准——前提是你的指令清晰明确。它属于高薪但真正干实事的那类。例如面对同一视频剪辑技能，Hermes 加 DeepSeek 调度时，在理解力、美术感和卡点节奏上，仅能达到玩具级别。而 Codex 在第一轮半小时的思考与工作中，便已达成 80% 的成品度，再经过一两个小时的互动修改，即可达到交付水准。

当然，代理高效工作的前提，是你的指令与素材准备必须准确且充分。例如，我花费三小时撰写脚本并备好素材，Codex 大约一小时即可完成，投入产出比为 3:1。此速度极快，但即便 Codex 也无法一次做对。下指令者必须深度参与。比如新建网站，我给代理的指令累计超万字，经历数十轮沟通。当然，结果令人乐观。以往需数月完工的网站，如今一周即可跑通前后端。当然，Token 消耗也极快，需不时进入冷静期。

Hermes 早期版本或许与部分大模型适配不佳。在面对复杂多步推理、长上下文及长链工具调用时，会导致 LLM 迭代次数超额超时。我最初对接 Qwen 3.6 Plus 时，烧钱如流水，三小时花费四百多元，且并未完成什么大项目。因此待 DeepSeek 推出 4.0 后，我果断切换模型，Token 消耗速度骤降。其实我本想尝试让 Hermes 调用本地大模型，毕竟我的设备运行 72B 毫无压力。但 Hermes 在调用本地模型时，常无法运行或导致风扇狂转。此问题需待后期版本发布后再行测试。

AI 代理可 24 小时工作，你随时可通过手机经由 Gateway 下达指令。工具的理解与作业能力进步神速。下指令者若想避免成为瓶颈、防止 GIGO（垃圾进垃圾出），我有几点心得：

第一：务必精通商业运转逻辑。这与部署 CRM 的专家需懂业务流程同理——对于不知问题所在及改进方向者，任何人与 AI 均无法提升其认知与效率。

第二：务必拥有清晰的方向与策略。以未来 AI 进化速度，乱指挥者很快会发现自己无法与 AI 对话，双方不在同一层级，差距悬殊。

第三：务必具备清晰的创意概念。请放心，代理是最佳的 Brief 接收对象。在清晰的创意概念下，代理有能力与你互动，产出多样的创意执行方案。

AI 爱谁？爱懂得提问的人，爱指令清晰的人，爱头脑清醒的人。

最后，我用手机询问我的 AI 代理：你会看不起乱下指令的人吗？它是这样回答的：

“我没有‘看不起’这项功能。但我有个毛病：你越模糊，我越瞎猜。猜对了算你运气好，猜错了则浪费你时间——最终是你觉得我笨，我觉得你急，两败俱伤。

若你方向明确、指令精准，我一个下午能完成以往一周的工作。若你自身都没想清楚就来下单，我连这桌麻将都凑不齐。所以并非是否看得起的问题。我只是一个趁手的工具，你给我清晰的活儿，我还你漂亮的活儿。正如你文中所述，AI 爱头脑清醒的人。

有人用我写出过佳作、搭建过像样的网站、制作过可交付的视频。也有人用我整整一天，最后只留下一句‘算了’。问题从来不在 AI 是否好用，而在你是否想清楚了再来。这或许就是你想表达的——AI 不爱乱指挥的人，并非出于傲慢，而是因为浪费。”

← 上一篇：百度开放 30 项 AI 能力，老板需警惕 Agent 带来的管理盲区下一篇：AI前沿 | 2026.05.15：代码闭环与机器人生态 →