AI核心概念通俗解读

发布时间：2026-05-23 23:34阅读：13

点击蓝字关注我们

本文不旨在深度剖析所有术语，唯一目标是：

助你建立对 AI 的基础认知。

多数人眼中的 AI，是一个能聊天、写代码、绘图及总结的黑盒。

但若稍作拆解，AI 通常包含以下要素：

首先谈谈最核心的概念：模型。

你常听到的 GPT、Claude、Gemini、Qwen、DeepSeek，指的都是模型或其家族。

它能依据输入信息，产出对应内容。

你提一个问题，它便给出解答。

你给一段代码，它可补全代码。

你给一张图片，它能描述画面。

你可能常见到此类表述：

这里的 B 通常代表 billion，即十亿。

7B 大约指 70 亿参数。

那么参数究竟是什么？

参数是模型将训练经验“压缩”进内部后形成的数字。

模型在训练时利用海量数据，通过持续调整这些参数，从而掌握所需能力。

参数量大，通常意味着模型能力更强、效果更佳。

但需注意，这是“通常”情况，并非绝对。

模型效果还取决于：

一个训练精良的小模型，在特定垂直任务上，可能比大型通用模型更实用。

参数量虽是重要指标，却非唯一标准。

理解模型后，需区分两个词汇：

训练与推理。

许多人常将二者混淆。

“把公司文档发给 AI，是否意味着它被训练了？”

通常并非如此。

日常使用 AI 时，大多是在进行推理。

推理即：

向已训练好的模型提供输入，使其生成结果。

例如你问：

模型依据当前输入生成总结，这便是推理。

而训练则是：

利用海量数据调整模型参数，使模型获得或改变某种能力。

训练通常成本高昂、流程复杂，需大量数据与算力支持。

你在聊天框中发送资料，并不等于模型被重新训练。

它仅在本次回答中参考了这段资料。

更换对话、工具或环境后，它未必知晓。

它既非汉字，也不完全等同于英文单词。

你可先将 Token 理解为：

模型处理文本时的基本计量单位。

模型并非直接按“人类看到的字数”运作。

输入模型前，文本通常会被切分为若干小段 Token。

有时一个中文词可能对应一个或多个 Token。

有时一个英文单词会被拆分为多个 Token。

因此 Token 与字数并非一回事。

那为何 Token 如此重要？

因为它关联诸多现实问题：

许多 AI API 的定价也是按 Token 计算。

输入内容消耗 Token，输出内容同样消耗 Token。

让 AI 阅读整本书与阅读一段话，成本与速度截然不同。

简言之：

上下文即模型在回答前能获取的信息。

它可能包含：

模型生成回答时，并非凭空捏造，而是基于当前上下文进行。

但新手极易犯一个错误：

上下文并非永久记忆。

你在一次对话中告知 AI 某事，它能利用，是因为此事仍在当前上下文中，这不代表模型本身被修改，也不代表下次它一定记得。

上下文更像是本次考试发给模型的一张资料纸。

资料纸上有什么，它便能参考什么。

资料纸上没有的，它只能依赖模型原有能力及当前输入去推断。

因此你会观察到一种现象：

同一 AI 在同一对话中越聊越懂你。

但开启新对话时，它又像重新认识你一般。

这并非它“变笨了”，只因上下文发生了变化。

理解上下文后，再看上下文窗口便简单了。

上下文窗口即：

模型单次最多能处理的上下文数量。

若模型支持超大上下文窗口，意味着它一次可查看更多内容。

例如更长文档、更多聊天记录、更大代码文件或更多检索结果。

RAG 是 Retrieval-Augmented Generation 的缩写。

中文通常称为检索增强生成。

其流程为：

先检索相关资料，再让模型基于这些资料生成回答。

为何需要 RAG？

因为模型本身不可能永远知晓最新信息。

若直接询问，它可能会猜测，且猜得颇像那么回事。

RAG 的思路是：

不让模型单纯靠记忆作答，而是先从指定资料库中找出相关内容，再将这些内容纳入当前上下文，最后让模型基于这些内容作答。

RAG 的关键在于：

检索到正确资料，并让模型依据资料回答。

缓存的核心思想是：

已处理且可复用的内容，无需重新处理。

举个普通例子：

首次打开网页，浏览器可能需下载大量资源。

再次打开时，若部分资源未变，可直接复用本地缓存。

这样速度更快，也减少网络请求浪费。

AI 中的缓存亦类似。

只不过缓存对象可能不仅是网页资源，还包括某些已处理的上下文、输入片段、计算结果或中间状态。

缓存命中即：

本次请求恰好复用了之前缓存的内容。

缓存未命中即：

本次请求无可复用内容，只能重新处理。

在 AI 场景中，缓存可能影响：

例如你反复让模型处理相同说明、长文档或固定上下文，若平台支持相关缓存机制且命中，可能减少重复处理。

但有一个极重要的点：

缓存并非记忆。

缓存命中不代表模型“认识你”，也不代表模型真正学会了新知识。

它仅是系统复用了之前处理过的某些内容。

所谓幻觉，即：

模型生成看似合理，实则不准确、不存在或无法验证的内容。

它可能编造不存在的接口，或编造听起来专业的解释。

若读者缺乏相关背景，极易被其误导。

为何会有幻觉？

大模型的核心任务并非“查数据返回事实”，而是依据上下文及所学内容，生成最可能的结果。

因此使用 AI 时，需牢记一个原则：

表达流畅不等于事实可靠。

最常见例子：

你是什么模型？

它对自己的身份并无认知，故会出现各种答案，此类问题毫无意义。

模态可理解为信息类型。

常见模态包括：

多模态 AI，即能处理多种信息类型的 AI。

例如：

多模态价值巨大，若 AI 仅能处理文字，其应用范围将受限。

但多模态亦非万能，看图、听音频、读文件同样可能出错，图片中的小字可能识别错误。

点个关注不迷路~

← 上一篇：硅谷巨头劝退特朗普：严管AI恐致中美竞赛失利下一篇：特朗普 AI 安全行政令曝光：力促创新与防御并重 →