标签

AI Agent如何实现真正应用

发布时间:2026-06-24 17:46阅读:2

去年商业闭源Manus与字节开源AI工作流编排Coze爆红,今年免费开源Openclaw及Hermes走红,腾讯主推的Work Buddy同样备受瞩目。然而大众依然认为AI Agent表面在飞速迭代,可实际投入工作时却总显得力不从心。为此我为大家整理分析,Agent究竟需达成哪些条件,方可切实应用落地。

撰写完本文,我深有感触,AI Agent的落地,依旧维持我去年的判断:

2026年,原型用

2027年,项目用

2028年,产品用 (1)个性化记忆 当前Agent在个性化记忆维度表现皆佳: Hermes的自动智能记忆、五层记忆架构 Openclaw的Dreaming梦境模式 (2)规划 一、大模型层面 大模型需具备长任务规划与拆解能力,这与其长上下文输入、长上下文理解及意图识别能力紧密相连。 二、Agent层面 多Agent协同进行任务拆解、调度与整合 (3)指令遵守 众人皆察觉大模型常不听话,需严厉督促方能老老实实遵循指示,此即指令遵守范畴。 指令遵守演进:指令跟随(2022)-提示词(2023)-长思维链(2024)-Skill与上下文工程(2025)-Loop工程(2026),持续优化。 一、Skill指令层面 Skill生态亟待丰富 Skill亦需依循Loop工程方法论更趋完善 二、大模型层面 大模型亦需开展后训练,针对Skill优化,更严格遵照Skill执行。 大模型本身亦需对长上下文输入/长上下文压缩、长上下文理解、意图识别及大模型价值观(独立思考-逻辑批判)予以强化。 三、Agent工具层面 Agent工具亦须在长上下文压缩方面发力,不可单纯仰仗大模型对长上下文的压缩。 (4)执行 一、浏览器Web页面操作 国内特殊的防机器人机制,尚未完成AI友好化改造。 二、软件操作 提示词+CLI模式、代码+MCP模式,尚无大量软件进行适配改造。 三、数据存取 1、在线数据存取:遭遇国内特殊的反爬机制 2、本地文件存取:需制定更适宜的权限策略。 3、数据存取:Excel读取(代码生成)、数据库读取(代码生成)。 4、内容存取:文档解析、图表OCR识别,技术尚未成熟,技术报告看似强大,实际应用效果堪忧。 四、代码生成 1、代码生成:此不仅关联大模型代码生成能力,亦与最佳代码研发工程实践Skill息息相关。 2、代码依赖库拉取-编译-安装-沙盒运行,全链路受制于国内防火墙及沙盒权限约束。