标签

揭秘AI进化史:从LLM到智能体的全链路解析

发布时间:2026-04-09 18:17来源:微信阅读:6

你是否曾好奇——

为何 ChatGPT 能编写代码、检索信息、代订机票?为何 AI 助手正变得越来越像"真人"?

其背后,有一条明确的技术演进路径:LLM → Token → Context → Prompt → Tool → MCP → Agent → Agent Skill。理解它,你就真正掌握了 AI 的未来。

LLM(大语言模型)是经过海量文本数据训练而成的超大型模型。

其底层架构为 Transformer——Google 于 2017 年在论文《Attention is All You Need》中提出。有趣的是,虽然 Google 发明了该架构,但率先实现工程化落地的却是 OpenAI。

2022 年 GPT-3.5 横空出世,让大众首次领略大模型的震撼。2023 年 GPT-4 发布,AI 讨论热度彻底爆发。此后 Claude、Gemini 竞相涌现,开启了群雄逐鹿的时代。

但 LLM 究竟在做什么?其实非常简单:

它实际上是在玩一个超级版的"文字接龙"游戏。

你输入一段文字 → 模型预测下一个最可能的词 → 继续预测 → 如此循环,直至回答结束。这里没有"理解",只有"预测"。然而,当预测足够精准时,效果便如同真正理解了一般。

LLM 处理文本的最小单位不是字也不是词,而是 Token。

你可以把 Token 看作"半个词":

"今天天气怎么样"这句话在模型眼中大约只有 4 个 Token。

这意味着什么?模型的处理成本、速度和限制均以 Token 为基准。你说的每一句话都在消耗 Token。

许多人误以为 AI 具有记忆,其实不然。

Context(上下文)是 LLM 每次处理请求时接收的"完整信息包",包括:

每次对话,平台都会将这整包内容发送给模型,让它"假装"记得之前的对话内容。

而 Context Window(上下文窗口)决定了这个"信息包"的上限:

100 万 Token ≈ 一整部长篇小说的文本量。

当文档超出上限时怎么办?这就需要用到 RAG(检索增强生成)——先将文档向量化存储,提问时仅插入相关片段,从而大幅降低成本。

Prompt(提示词)是你发送给 LLM 的指令,是影响模型输出最直接的因素。

Prompt 分为两种类型:

举个例子:如果 System Prompt 设置了"你是一位数学老师,不能直接给出答案,要引导学生思考",那么无论你问什么,模型都会遵守这一隐藏规则。

这也是为什么同一 AI 在不同产品中的表现差异巨大——因为其背后的 System Prompt 不同。

Prompt 越清晰、越具体,模型的表现就越好。这就是所谓的"Prompt 工程"的价值。

LLM 本质上只能预测文字,它无法:

Tool(工具)解决了这个问题。工具调用的流程如下:

注意:模型本身无法执行工具,只能"点菜",真正做菜的是平台。

角色分工明确:模型负责决策,工具负责执行,平台负责中转。

工具增多后,问题随之而来:ChatGPT、Claude、Gemini 各有一套接入标准,开发者必须为同一个工具编写多套代码,维护成本极高。

MCP(Model Context Protocol,模型上下文协议)正是为解决此问题而生的。

用一个类比来说明:

MCP = AI 世界的 USB Type-C

统一标准,一次适配,所有支持 MCP 的平台均可使用。

工具开发者只需遵循 MCP 规范编写一次代码,即可在所有主流 AI 平台上运行。如今,MCP 已成为 AI 生态中工具集成的主流标准。

普通对话:你提问 → AI 回答。问答结束。

Agent(智能代理)则完全不同:

你给出一个任务 → Agent 自主规划步骤 → 调用工具 → 逐步执行 → 完成任务

举个例子:你说"帮我找附近的本地特产店"

全程无需干预,Agent 自己规划并执行。这就是从 LLM 到 Agent 的质的飞跃。

主流 Agent 产品包括:Claude Code、Codex、Gemini CLI、OpenClaw 等。

虽然 Agent 功能强大,但每次执行复杂任务都必须在 Prompt 中编写完整要求,既冗长又难以维护。

Agent Skill 旨在解决此问题——它是一份 Markdown 格式的"说明文档",指导 Agent:

一个标准的 Skill 文件(SKILL.md)包含:名称、功能描述、执行步骤、判断规则、输出格式。

最妙的是其懒加载机制:Agent 不会一次性读取所有 Skill,仅当任务触发时才加载对应的 SKILL.md,从而大幅节省 Token。

Skill 与 MCP 工具配合,实现了"行为规范 + 工具能力"的统一封装。

读到这里,你已经掌握了整条进化链。让我们用一张概念关系图来总结:

AI 不是魔法,而是工程。理解这条进化链,你就理解了 AI 为何越来越强大——以及它还缺少什么。

你最想深入了解哪个环节?请留言告诉我 👇