聚焦智能体开发：CSDN与AMD共探AI工程化实践

发布时间：2026-06-14 21:44阅读：24

大模型竞争进入下半场，核心在于“上下文分层架构设计”。

近年来AI浪潮席卷全球，开发者们对大模型的认知逐年深化，一个贯穿始终的问题也日益具体化、无法回避：大模型虽强，究竟何时才能真正“替我们完成任务”？

从单轮对话到如今的智能体（Agent）时代，软件开发的底层逻辑正经历一场静默的变革。开发者的关注重点，正迅速从单纯的“如何撰写提示词”，升级为如何进行深度的“系统工程设计”——我们需要对Token进行分配与分层上下文管理，需要用可复用的Skills连接真实业务，更需要设计精密的运行Loop。

6月13日，由CSDN与AMD联合举办的“AI开发沙龙·智能体工坊”圆满落幕。活动聚焦Agent时代下的开发范式转变，围绕Token、本地部署、上下文工程、智能体框架、典型应用场景与工程化落地等核心议题，邀请OceanBase、DeerFlow、AMD的技术专家展开系统分享，并通过实践工坊带领开发者深入实战环节。

自1999年创立至今，CSDN已汇聚5300万开发者，成长为全球第二大开发者社区。在2026年AI大时代下，如何赋能开发者和企业的智能化转型？

CSDN内容事业部负责人孟迎霞表示，在每个技术跃迁的关键节点，CSDN始终扮演“领先半步”的同行者角色。“如果领先太多，技术离实际工作太远，就难以真正产生价值；但如果能领先半步，就能向业界展示正在发生什么，未来走向何方。仰望星空的过程，对技术人而言至关重要。”

这也是CSDN持续投入线下活动、技术报告、专家访谈和研究型内容的关键原因。围绕AI大时代的新变化，孟迎霞分享了CSDN在开发者生态方面的几个重要举措：

持续夯实开发者社区基础，围绕博客、问答、搜索、创作等场景构建内容与知识服务能力；

与AtomGit共同打造开源代码及人工智能社区，支持优秀项目成长与生态连接；

通过《新程序员》、各类技术报告、视频栏目和直播节目，持续输出前沿洞察；

成立“奇点智能研究院”，面向技术管理者与企业智能化升级需求，提供更深层次的研究、连接与咨询服务。

如今，“人人都是程序员，行行都将智能化，万物皆可编程”正成为现实，CSDN也从内容平台全面升级为开发者生产力平台。为此，起点智能研究院于今年4月正式发布了《AISMM 2026 AI原生软件研发成熟度模型白皮书》。孟迎霞指出：“企业研发团队要真正完成AI原生化升级，并非购买几个工具那么简单。”这涉及基础设施、知识工程、组织人才和安全治理等多维度的系统工程，白皮书旨在为企业软件研发的AI原生化演进提供一套可量化的坐标系。

作为大模型应用最基础的处理机制，Token常被直观理解为“一个字”或“一个词”。OceanBase技术专家汤庆指出，模型本质上无法直接处理自然语言，而是通过BPE（Byte Pair Encoding）等子词切分算法将文本转化为数字序列。大模型的底层逻辑，是在已有上下文基础上，通过概率建模持续预测下一个最可能出现的Token。

由此，汤庆提出了一个核心观点：“大模型应用，本质上是Token分配的艺术。”无论是传统的提示词工程（Prompt Engineering），还是最新的上下文工程（Context Engineering）和循环工程（Loop Engineering），本质上都在解决同一个问题——如何在有限的窗口里，把最关键的信息在最合适的位置呈现给模型。

针对长上下文中极易被忽视的“中心衰减”问题，汤庆提出，未来大模型应用需要一个“可检索、可溯源、可演进”的上下文系统（Context SIG）。该系统将上下文分层管理（原始信息L0、摘要信息L1、抽取的知识Skills L2），并创造性地引入了“梦境机制”：在系统空闲时让其对现有上下文进行发散推演，利用置信度衰减体系自我强化与纠偏，最终将零散的上下文沉淀为高价值、可复用的个性化Skills。

“智能体并非只是一个'更擅长对话'的模型，而是一个以目标为导向的系统。”DeerFlow核心贡献者姜宁指出，Agent与单体LLM的核心区别在于其具备ReAct循环（Reason思考、Act执行、Observe观察），这决定了Agent能否稳定地将任务持续推进下去。

在DeerFlow从1.0深度研究（Deep Research）迈向2.0通用Super Agent的演进中，“Skills（能力包）”成为至关重要的能力解耦层。姜宁表示：“大模型负责推理，而Skills负责连接具体的业务世界。”通过加载不同的Skills，Agent可以在数据分析、内容创作、代码处理等任务间动态切换。

同时，姜宁深入剖析了智能体工程实现中的关键痛点：Memory的长期偏好积累、Sandbox的隔离环境、以及通过中间结果落盘进行Context长度和Token消耗的管理。他强调：“很多坑，比如Tool Result过长、上下文膨胀、调用失败如何处理、高并发如何观测、长链路如何容错，这些都不是在PPT里能学会的，而是在真实项目中一点一点在实践中摸索出来的。”深度参与开源、在真实场景中试错，正是开发者成长最快的路径。

在真实工作流中，Agent的长期落地必须算清楚“算力与成本”这笔硬账。AMD ROCm软件与方案架构师Charles Yang认为：“一个精心设计的Loop，有时候甚至比模型本身更重要。”模型只是大脑，而负责上下文管理和Loop调度的Runtime，才决定了系统运行的稳定性。

他横向对比了当前最火热的两大Agent路线：常驻多通道协作的OpenManus，与强调长期记忆、可自进化的Hermes。虽然工具生态极大地释放了生产力，但随着使用频次上升，高频Agent正成为一个极其耗资的Token消耗黑洞。由于长系统提示词、海量工具调用日志以及多轮循环重试，Agent运行的推理成本会呈几何级增长。

基于此，“本地部署正从'隐私保护'的附加项，转变为长期运行Agent的'成本最优解'。”Charles Yang介绍，依托AMD Radeon AI PC的全栈生态，其统一内存架构（CPU、GPU、NPU共享大容量显存）能有效消除传统跨总线搬运数据的性能瓶颈，非常契合Agent需要一边做模型推理、一边高频调度工具与文件的序贯决策场景。配合ROCm全栈软件协同，本地部署正成为开发者低成本、零门槛玩转Agent的刚性选择。

随着主题分享结束，活动现场也从“听”转向“做”，进入本次“智能体工坊”的核心环节。

前半场关于Token、上下文工程、ReAct、Skills、Memory、Tools、本地部署的分享，为后续实操搭建起了一条比较完整的理解路径：先理解模型如何处理信息，再理解Agent如何组织任务、调用工具、保留状态，最后再进入实际环境，体验一套智能体系统如何被搭建和运行。

进入Workshop环节后，现场氛围也随之转换。Charles Yang从台上讲解逐步转入具体操作，台下不少开发者一边跟随步骤配置环境，一边对照前面分享中提到的模型、上下文、工具链和运行机制，现场交流明显增多。有人边听边记，有人直接打开电脑同步操作，也有人围绕部署细节、调用流程和运行结果与身边同伴低声讨论。

对于到场参与者而言，前半场建立的是认知框架，后半场则把这些概念进一步落到实际操作中。

在动手过程中，Token、上下文、运行时、工具调用这些原本相对抽象的概念，也随着环境配置、任务执行和系统运行过程变得更加具体。开发者不再只是“听到”一个Agent的工作方式，而是开始在实际操作里感受它如何被搭起来、如何运行、又会在哪些环节产生差异。

随着AI应用持续从问答走向执行，开发者对智能体系统的关注点，也正从模型能力逐步扩展到系统能力、工程能力与运行能力。如何把模型接入真实工作流，如何让智能体具备持续运行和迭代能力，正成为越来越多开发者关心的话题。

此次活动通过主题分享与Workshop结合的形式，为开发者提供了从理解Agent到体验Agent的交流场景。未来，围绕AI原生开发、智能体工程与开发者生态的讨论，也将持续深入展开。

← 上一篇：案情逆转！确认为 AI 伪造下一篇：杭州消费者万元购LV鸵鸟皮包遇质量问题，官方回应正在跟进处理 →