标签

AI核心概念通俗解读

发布时间:2026-05-23 23:34来源:微信阅读:6

点击蓝字 关注我们

本文不旨在深度剖析所有术语,唯一目标是:

助你建立对 AI 的基础认知。

多数人眼中的 AI,是一个能聊天、写代码、绘图及总结的黑盒。

但若稍作拆解,AI 通常包含以下要素:

首先谈谈最核心的概念:模型。

你常听到的 GPT、Claude、Gemini、Qwen、DeepSeek,指的都是模型或其家族。

它能依据输入信息,产出对应内容。

你提一个问题,它便给出解答。

你给一段代码,它可补全代码。

你给一张图片,它能描述画面。

你可能常见到此类表述:

这里的 B 通常代表 billion,即十亿。

7B 大约指 70 亿参数。

那么参数究竟是什么?

参数是模型将训练经验“压缩”进内部后形成的数字。

模型在训练时利用海量数据,通过持续调整这些参数,从而掌握所需能力。

参数量大,通常意味着模型能力更强、效果更佳。

但需注意,这是“通常”情况,并非绝对。

模型效果还取决于:

一个训练精良的小模型,在特定垂直任务上,可能比大型通用模型更实用。

参数量虽是重要指标,却非唯一标准。

理解模型后,需区分两个词汇:

训练与推理。

许多人常将二者混淆。

“把公司文档发给 AI,是否意味着它被训练了?”

通常并非如此。

日常使用 AI 时,大多是在进行推理。

推理即:

向已训练好的模型提供输入,使其生成结果。

例如你问:

模型依据当前输入生成总结,这便是推理。

而训练则是:

利用海量数据调整模型参数,使模型获得或改变某种能力。

训练通常成本高昂、流程复杂,需大量数据与算力支持。

你在聊天框中发送资料,并不等于模型被重新训练。

它仅在本次回答中参考了这段资料。

更换对话、工具或环境后,它未必知晓。

它既非汉字,也不完全等同于英文单词。

你可先将 Token 理解为:

模型处理文本时的基本计量单位。

模型并非直接按“人类看到的字数”运作。

输入模型前,文本通常会被切分为若干小段 Token。

有时一个中文词可能对应一个或多个 Token。

有时一个英文单词会被拆分为多个 Token。

因此 Token 与字数并非一回事。

那为何 Token 如此重要?

因为它关联诸多现实问题:

许多 AI API 的定价也是按 Token 计算。

输入内容消耗 Token,输出内容同样消耗 Token。

让 AI 阅读整本书与阅读一段话,成本与速度截然不同。

简言之:

上下文即模型在回答前能获取的信息。

它可能包含:

模型生成回答时,并非凭空捏造,而是基于当前上下文进行。

但新手极易犯一个错误:

上下文并非永久记忆。

你在一次对话中告知 AI 某事,它能利用,是因为此事仍在当前上下文中,这不代表模型本身被修改,也不代表下次它一定记得。

上下文更像是本次考试发给模型的一张资料纸。

资料纸上有什么,它便能参考什么。

资料纸上没有的,它只能依赖模型原有能力及当前输入去推断。

因此你会观察到一种现象:

同一 AI 在同一对话中越聊越懂你。

但开启新对话时,它又像重新认识你一般。

这并非它“变笨了”,只因上下文发生了变化。

理解上下文后,再看上下文窗口便简单了。

上下文窗口即:

模型单次最多能处理的上下文数量。

若模型支持超大上下文窗口,意味着它一次可查看更多内容。

例如更长文档、更多聊天记录、更大代码文件或更多检索结果。

RAG 是 Retrieval-Augmented Generation 的缩写。

中文通常称为检索增强生成。

其流程为:

先检索相关资料,再让模型基于这些资料生成回答。

为何需要 RAG?

因为模型本身不可能永远知晓最新信息。

若直接询问,它可能会猜测,且猜得颇像那么回事。

RAG 的思路是:

不让模型单纯靠记忆作答,而是先从指定资料库中找出相关内容,再将这些内容纳入当前上下文,最后让模型基于这些内容作答。

RAG 的关键在于:

检索到正确资料,并让模型依据资料回答。

缓存的核心思想是:

已处理且可复用的内容,无需重新处理。

举个普通例子:

首次打开网页,浏览器可能需下载大量资源。

再次打开时,若部分资源未变,可直接复用本地缓存。

这样速度更快,也减少网络请求浪费。

AI 中的缓存亦类似。

只不过缓存对象可能不仅是网页资源,还包括某些已处理的上下文、输入片段、计算结果或中间状态。

缓存命中即:

本次请求恰好复用了之前缓存的内容。

缓存未命中即:

本次请求无可复用内容,只能重新处理。

在 AI 场景中,缓存可能影响:

例如你反复让模型处理相同说明、长文档或固定上下文,若平台支持相关缓存机制且命中,可能减少重复处理。

但有一个极重要的点:

缓存并非记忆。

缓存命中不代表模型“认识你”,也不代表模型真正学会了新知识。

它仅是系统复用了之前处理过的某些内容。

所谓幻觉,即:

模型生成看似合理,实则不准确、不存在或无法验证的内容。

它可能编造不存在的接口,或编造听起来专业的解释。

若读者缺乏相关背景,极易被其误导。

为何会有幻觉?

大模型的核心任务并非“查数据返回事实”,而是依据上下文及所学内容,生成最可能的结果。

因此使用 AI 时,需牢记一个原则:

表达流畅不等于事实可靠。

最常见例子:

你是什么模型?

它对自己的身份并无认知,故会出现各种答案,此类问题毫无意义。

模态可理解为信息类型。

常见模态包括:

多模态 AI,即能处理多种信息类型的 AI。

例如:

多模态价值巨大,若 AI 仅能处理文字,其应用范围将受限。

但多模态亦非万能,看图、听音频、读文件同样可能出错,图片中的小字可能识别错误。

点个关注不迷路~