标签

聚焦智能体开发:CSDN与AMD共探AI工程化实践

发布时间:2026-06-14 21:44阅读:1

大模型竞争进入下半场,核心在于“上下文分层架构设计”。

近年来AI浪潮席卷全球,开发者们对大模型的认知逐年深化,一个贯穿始终的问题也日益具体化、无法回避:大模型虽强,究竟何时才能真正“替我们完成任务”?

从单轮对话到如今的智能体(Agent)时代,软件开发的底层逻辑正经历一场静默的变革。开发者的关注重点,正迅速从单纯的“如何撰写提示词”,升级为如何进行深度的“系统工程设计”——我们需要对Token进行分配与分层上下文管理,需要用可复用的Skills连接真实业务,更需要设计精密的运行Loop。

6月13日,由CSDN与AMD联合举办的“AI开发沙龙·智能体工坊”圆满落幕。活动聚焦Agent时代下的开发范式转变,围绕Token、本地部署、上下文工程、智能体框架、典型应用场景与工程化落地等核心议题,邀请OceanBase、DeerFlow、AMD的技术专家展开系统分享,并通过实践工坊带领开发者深入实战环节。

自1999年创立至今,CSDN已汇聚5300万开发者,成长为全球第二大开发者社区。在2026年AI大时代下,如何赋能开发者和企业的智能化转型?

CSDN内容事业部负责人孟迎霞表示,在每个技术跃迁的关键节点,CSDN始终扮演“领先半步”的同行者角色。“如果领先太多,技术离实际工作太远,就难以真正产生价值;但如果能领先半步,就能向业界展示正在发生什么,未来走向何方。仰望星空的过程,对技术人而言至关重要。”

这也是CSDN持续投入线下活动、技术报告、专家访谈和研究型内容的关键原因。围绕AI大时代的新变化,孟迎霞分享了CSDN在开发者生态方面的几个重要举措:

持续夯实开发者社区基础,围绕博客、问答、搜索、创作等场景构建内容与知识服务能力;

与AtomGit共同打造开源代码及人工智能社区,支持优秀项目成长与生态连接;

通过《新程序员》、各类技术报告、视频栏目和直播节目,持续输出前沿洞察;

成立“奇点智能研究院”,面向技术管理者与企业智能化升级需求,提供更深层次的研究、连接与咨询服务。

如今,“人人都是程序员,行行都将智能化,万物皆可编程”正成为现实,CSDN也从内容平台全面升级为开发者生产力平台。为此,起点智能研究院于今年4月正式发布了《AISMM 2026 AI原生软件研发成熟度模型白皮书》。孟迎霞指出:“企业研发团队要真正完成AI原生化升级,并非购买几个工具那么简单。”这涉及基础设施、知识工程、组织人才和安全治理等多维度的系统工程,白皮书旨在为企业软件研发的AI原生化演进提供一套可量化的坐标系。

作为大模型应用最基础的处理机制,Token常被直观理解为“一个字”或“一个词”。OceanBase技术专家汤庆指出,模型本质上无法直接处理自然语言,而是通过BPE(Byte Pair Encoding)等子词切分算法将文本转化为数字序列。大模型的底层逻辑,是在已有上下文基础上,通过概率建模持续预测下一个最可能出现的Token。

由此,汤庆提出了一个核心观点:“大模型应用,本质上是Token分配的艺术。”无论是传统的提示词工程(Prompt Engineering),还是最新的上下文工程(Context Engineering)和循环工程(Loop Engineering),本质上都在解决同一个问题——如何在有限的窗口里,把最关键的信息在最合适的位置呈现给模型。

针对长上下文中极易被忽视的“中心衰减”问题,汤庆提出,未来大模型应用需要一个“可检索、可溯源、可演进”的上下文系统(Context SIG)。该系统将上下文分层管理(原始信息L0、摘要信息L1、抽取的知识Skills L2),并创造性地引入了“梦境机制”:在系统空闲时让其对现有上下文进行发散推演,利用置信度衰减体系自我强化与纠偏,最终将零散的上下文沉淀为高价值、可复用的个性化Skills。

“智能体并非只是一个'更擅长对话'的模型,而是一个以目标为导向的系统。”DeerFlow核心贡献者姜宁指出,Agent与单体LLM的核心区别在于其具备ReAct循环(Reason思考、Act执行、Observe观察),这决定了Agent能否稳定地将任务持续推进下去。

在DeerFlow从1.0深度研究(Deep Research)迈向2.0通用Super Agent的演进中,“Skills(能力包)”成为至关重要的能力解耦层。姜宁表示:“大模型负责推理,而Skills负责连接具体的业务世界。”通过加载不同的Skills,Agent可以在数据分析、内容创作、代码处理等任务间动态切换。

同时,姜宁深入剖析了智能体工程实现中的关键痛点:Memory的长期偏好积累、Sandbox的隔离环境、以及通过中间结果落盘进行Context长度和Token消耗的管理。他强调:“很多坑,比如Tool Result过长、上下文膨胀、调用失败如何处理、高并发如何观测、长链路如何容错,这些都不是在PPT里能学会的,而是在真实项目中一点一点在实践中摸索出来的。”深度参与开源、在真实场景中试错,正是开发者成长最快的路径。

在真实工作流中,Agent的长期落地必须算清楚“算力与成本”这笔硬账。AMD ROCm软件与方案架构师Charles Yang认为:“一个精心设计的Loop,有时候甚至比模型本身更重要。”模型只是大脑,而负责上下文管理和Loop调度的Runtime,才决定了系统运行的稳定性。

他横向对比了当前最火热的两大Agent路线:常驻多通道协作的OpenManus,与强调长期记忆、可自进化的Hermes。虽然工具生态极大地释放了生产力,但随着使用频次上升,高频Agent正成为一个极其耗资的Token消耗黑洞。由于长系统提示词、海量工具调用日志以及多轮循环重试,Agent运行的推理成本会呈几何级增长。

基于此,“本地部署正从'隐私保护'的附加项,转变为长期运行Agent的'成本最优解'。”Charles Yang介绍,依托AMD Radeon AI PC的全栈生态,其统一内存架构(CPU、GPU、NPU共享大容量显存)能有效消除传统跨总线搬运数据的性能瓶颈,非常契合Agent需要一边做模型推理、一边高频调度工具与文件的序贯决策场景。配合ROCm全栈软件协同,本地部署正成为开发者低成本、零门槛玩转Agent的刚性选择。

随着主题分享结束,活动现场也从“听”转向“做”,进入本次“智能体工坊”的核心环节。

前半场关于Token、上下文工程、ReAct、Skills、Memory、Tools、本地部署的分享,为后续实操搭建起了一条比较完整的理解路径:先理解模型如何处理信息,再理解Agent如何组织任务、调用工具、保留状态,最后再进入实际环境,体验一套智能体系统如何被搭建和运行。

进入Workshop环节后,现场氛围也随之转换。Charles Yang从台上讲解逐步转入具体操作,台下不少开发者一边跟随步骤配置环境,一边对照前面分享中提到的模型、上下文、工具链和运行机制,现场交流明显增多。有人边听边记,有人直接打开电脑同步操作,也有人围绕部署细节、调用流程和运行结果与身边同伴低声讨论。

对于到场参与者而言,前半场建立的是认知框架,后半场则把这些概念进一步落到实际操作中。

在动手过程中,Token、上下文、运行时、工具调用这些原本相对抽象的概念,也随着环境配置、任务执行和系统运行过程变得更加具体。开发者不再只是“听到”一个Agent的工作方式,而是开始在实际操作里感受它如何被搭起来、如何运行、又会在哪些环节产生差异。

随着AI应用持续从问答走向执行,开发者对智能体系统的关注点,也正从模型能力逐步扩展到系统能力、工程能力与运行能力。如何把模型接入真实工作流,如何让智能体具备持续运行和迭代能力,正成为越来越多开发者关心的话题。

此次活动通过主题分享与Workshop结合的形式,为开发者提供了从理解Agent到体验Agent的交流场景。未来,围绕AI原生开发、智能体工程与开发者生态的讨论,也将持续深入展开。