揭秘AI进化史:从LLM到智能体的全链路解析
你是否曾好奇——
为何 ChatGPT 能编写代码、检索信息、代订机票?为何 AI 助手正变得越来越像"真人"?
其背后,有一条明确的技术演进路径:LLM → Token → Context → Prompt → Tool → MCP → Agent → Agent Skill。理解它,你就真正掌握了 AI 的未来。
LLM(大语言模型)是经过海量文本数据训练而成的超大型模型。
其底层架构为 Transformer——Google 于 2017 年在论文《Attention is All You Need》中提出。有趣的是,虽然 Google 发明了该架构,但率先实现工程化落地的却是 OpenAI。
2022 年 GPT-3.5 横空出世,让大众首次领略大模型的震撼。2023 年 GPT-4 发布,AI 讨论热度彻底爆发。此后 Claude、Gemini 竞相涌现,开启了群雄逐鹿的时代。
但 LLM 究竟在做什么?其实非常简单:
它实际上是在玩一个超级版的"文字接龙"游戏。
你输入一段文字 → 模型预测下一个最可能的词 → 继续预测 → 如此循环,直至回答结束。这里没有"理解",只有"预测"。然而,当预测足够精准时,效果便如同真正理解了一般。
LLM 处理文本的最小单位不是字也不是词,而是 Token。
你可以把 Token 看作"半个词":
"今天天气怎么样"这句话在模型眼中大约只有 4 个 Token。
这意味着什么?模型的处理成本、速度和限制均以 Token 为基准。你说的每一句话都在消耗 Token。
许多人误以为 AI 具有记忆,其实不然。
Context(上下文)是 LLM 每次处理请求时接收的"完整信息包",包括:
每次对话,平台都会将这整包内容发送给模型,让它"假装"记得之前的对话内容。
而 Context Window(上下文窗口)决定了这个"信息包"的上限:
100 万 Token ≈ 一整部长篇小说的文本量。
当文档超出上限时怎么办?这就需要用到 RAG(检索增强生成)——先将文档向量化存储,提问时仅插入相关片段,从而大幅降低成本。
Prompt(提示词)是你发送给 LLM 的指令,是影响模型输出最直接的因素。
Prompt 分为两种类型:
举个例子:如果 System Prompt 设置了"你是一位数学老师,不能直接给出答案,要引导学生思考",那么无论你问什么,模型都会遵守这一隐藏规则。
这也是为什么同一 AI 在不同产品中的表现差异巨大——因为其背后的 System Prompt 不同。
Prompt 越清晰、越具体,模型的表现就越好。这就是所谓的"Prompt 工程"的价值。
LLM 本质上只能预测文字,它无法:
Tool(工具)解决了这个问题。工具调用的流程如下:
注意:模型本身无法执行工具,只能"点菜",真正做菜的是平台。
角色分工明确:模型负责决策,工具负责执行,平台负责中转。
工具增多后,问题随之而来:ChatGPT、Claude、Gemini 各有一套接入标准,开发者必须为同一个工具编写多套代码,维护成本极高。
MCP(Model Context Protocol,模型上下文协议)正是为解决此问题而生的。
用一个类比来说明:
MCP = AI 世界的 USB Type-C
统一标准,一次适配,所有支持 MCP 的平台均可使用。
工具开发者只需遵循 MCP 规范编写一次代码,即可在所有主流 AI 平台上运行。如今,MCP 已成为 AI 生态中工具集成的主流标准。
普通对话:你提问 → AI 回答。问答结束。
Agent(智能代理)则完全不同:
你给出一个任务 → Agent 自主规划步骤 → 调用工具 → 逐步执行 → 完成任务
举个例子:你说"帮我找附近的本地特产店"
全程无需干预,Agent 自己规划并执行。这就是从 LLM 到 Agent 的质的飞跃。
主流 Agent 产品包括:Claude Code、Codex、Gemini CLI、OpenClaw 等。
虽然 Agent 功能强大,但每次执行复杂任务都必须在 Prompt 中编写完整要求,既冗长又难以维护。
Agent Skill 旨在解决此问题——它是一份 Markdown 格式的"说明文档",指导 Agent:
一个标准的 Skill 文件(SKILL.md)包含:名称、功能描述、执行步骤、判断规则、输出格式。
最妙的是其懒加载机制:Agent 不会一次性读取所有 Skill,仅当任务触发时才加载对应的 SKILL.md,从而大幅节省 Token。
Skill 与 MCP 工具配合,实现了"行为规范 + 工具能力"的统一封装。
读到这里,你已经掌握了整条进化链。让我们用一张概念关系图来总结:
AI 不是魔法,而是工程。理解这条进化链,你就理解了 AI 为何越来越强大——以及它还缺少什么。
你最想深入了解哪个环节?请留言告诉我 👇