AI协助与AI代劳的区别:个人Agent工作流搭建实战记录
这篇文章是「AI信息守门员」系列的下集。上一篇探讨了怎样利用AI进行信息过滤,这一篇我们谈谈后续动作——如何将过滤出的优质信息转化为实际行动。
👤 此部分由作者亲自撰写
上一期我们讨论了AI信息守门员——协助你屏蔽无效噪音。有读者好奇:被筛选出的高价值信息,究竟该如何落地执行?
黄仁勋在GTC大会上曾表示:“未来的计算机将不再单纯运行应用程序,而是运行智能体。”这句话听起来十分宏大,但在亲自构建了专属的Agent工作流后,我意识到核心并非“让AI代劳”,而是“明确分工”。
🤖👤 概念界定👤人类主导,行业资讯引用🤖AI辅助梳理
很多人对Agent的认知,还停留在给ChatGPT加个插件——你下达指令,它就去执行。然而,真正的Agent工作流并非如此简单。
Agent并不等同于套壳的聊天机器人。Agent是一个协助你落实决策的系统。两者的差异在于:聊天机器人试图替你做决定,而Agent则是帮你执行你已经确定的决定。
英伟达提出了“Agentic AI时代”的概念,微软则将Agent提升为Windows系统的核心功能——整个行业都在向这一趋势迈进。不过,futurepicker早在三月份就道出了真相:“不要让Agent去决策,而是让它去执行。”
在搭建了一个月之后,我最大的感悟是:关键不在于Agent是否有能力完成,而在于每一个环节都要清晰标注——是交给AI处理,还是由人工负责。
🤖👤 调度层🤖AI独立,执行层🤖👤协同,审核层👤人类最终掌控
Token纪年的内容运营本身就是一个完整的Agent工作流。我将这套系统划分为三个层级:
调度层 🤖:AI独立运作
信息收集由“灵阅”和“锐探”负责。每天早晨8点,锐探会自动抓取47条AI领域的最新资讯,并筛选出3条核心必读内容。灵阅则会依据选题雷达,开展竞品分析以及差异化评估。
这个层级完全无需我的介入。AI能够独立完成采集、过滤,并自动生成简报与雷达报告。我只需查阅最终的输出成果即可。
执行层 🤖👤:AI操作+人工把关
灵枢在获取灵阅的选题雷达数据后,会制定内容策划方案——包括切入角度、展现形式以及发布平台。不过,当策划方案提交给我时,我需要审查三个关键点:
在审核完毕后,墨工会负责生成图文素材,灵映则负责制作视频内容。但对于这些生成物,我仍需再次复核才能将其加入发布列表。
审核层 👤:人类最终控制
在任何内容正式发布之前,我会亲自进行三项核查:内容源头是否源于“我在构建系统”?素材是否符合规范?发布设置是否准确无误?
只有在全部核查通过后,晓红才会启动发布程序。若没有我授予的授权凭证,她绝不会擅自进行任何操作。
🤖👤 调度层🤖标识:AI完全独立,人类不干预日常运转 🤖👤 执行层🤖👤标识:AI完成核心产出,人类在关键环节把关 🤖👤 审核层👤标识:人类进行最终裁决,AI不具备自主发布资格
🤖👤 架构选择🤖👤协同,成本路由🤖AI操作,安全边界👤人类制定
决策一:选择架构而非平台 🤖👤
为何不采用Dify、Coze或n8n?并非因为它们表现不佳,而是由于平台锁定的潜在风险过大。我的系统需要连接B站、微信公众号、小红书及知乎等国内平台——这些平台的API接口与发布机制,国外的工具生态根本无法兼容。
英伟达的Open Shell与微软的WAF均采用YAML定义模式——你只需描述需求,架构便会协助你进行编排。这种“声明式”的逻辑,远比“拖拽式”操作来得更加灵活。
决策二:成本路由 🤖
Copilot价格从29美元飙升至750美元的教训告诉我们:当Agent自主调用推理模型时,极易引发成本失控。
我的路由方案是:日常调度任务(如锐探/灵阅)采用低成本模型,而复杂推理任务(如灵枢策划)则使用高性能模型。并非所有环节都必需GPT-5.5,但在核心决策环节绝不能吝啬成本。
决策三:安全边界 👤
BadHost漏洞是首例LLM Agent自主利用CVE的真实安全事件。Agent的自主性越高,设定安全边界就越发关键。
我的准则是:最小权限原则、凭证隔离机制以及审计日志记录。当晓红执行发布任务时,她的权限被严格限制在“发布已授权的内容”范围内,无法创建、修改或删除任何内容。任何异常行为都会被系统记录并触发警报。
🤖👤 过去👤人类包揽全流程,现在🤖👤协同(AI操作+人工把关)
过去:守门员筛选出优质信息→我逐一进行处理→我手工撰写文案→我手动进行发布。每一个步骤都依赖人工,至少需要耗费3到4个小时。
现在:守门员进行筛选→Agent自动分类与调度→半自动化执行→我审核并确认发布。人工决策的节点从无数个减少至3个,从获取信息到落地行动的时间被压缩至1.5到2小时。
不过坦白讲,在某些环节中,AI的速度反而较慢——例如生成小红书的竖版配图,AI生成图片加上我审核修改的时间,可能比我直接使用Canva制作还要慢。这并非效率低下,而是系统尚未调整至最佳状态。将这些“AI反而更慢”的环节如实记录下来,远比夸耀“效率提升了10倍”要更有意义。
🤖👤 预告属于👤人类主导的研判,MCP实现属于🤖👤协同
MCP的无状态化结合Secure Tunnel意味着什么?这意味着你的Obsidian知识库将不再仅仅是一个“存储仓库”,而是转变为Agent能够随时调用的“技能库”。
MCP生态目前已涵盖超过13000台服务器,每月的SDK下载量高达9700万次。正如2010年时,不懂得编写REST API的开发者会面临淘汰一样,到了2026年,不会搭建MCP Server的开发者也将遭遇相同的困境。
下周我们将探讨MCP的实战应用——如何将知识库打造为Agent的感知器官。
Agent不会代替你进行思考,但它能帮你将思考转化为实际行动。
本文作为「AI信息守门员」的续集,记录了Token纪年系统搭建的第14天。
Token纪年——属于普通人的AI知识系统实战记录。