AI核心概念通俗解读
点击蓝字 关注我们
本文不旨在深度剖析所有术语,唯一目标是:
助你建立对 AI 的基础认知。
多数人眼中的 AI,是一个能聊天、写代码、绘图及总结的黑盒。
但若稍作拆解,AI 通常包含以下要素:
首先谈谈最核心的概念:模型。
你常听到的 GPT、Claude、Gemini、Qwen、DeepSeek,指的都是模型或其家族。
它能依据输入信息,产出对应内容。
你提一个问题,它便给出解答。
你给一段代码,它可补全代码。
你给一张图片,它能描述画面。
你可能常见到此类表述:
这里的 B 通常代表 billion,即十亿。
7B 大约指 70 亿参数。
那么参数究竟是什么?
参数是模型将训练经验“压缩”进内部后形成的数字。
模型在训练时利用海量数据,通过持续调整这些参数,从而掌握所需能力。
参数量大,通常意味着模型能力更强、效果更佳。
但需注意,这是“通常”情况,并非绝对。
模型效果还取决于:
一个训练精良的小模型,在特定垂直任务上,可能比大型通用模型更实用。
参数量虽是重要指标,却非唯一标准。
理解模型后,需区分两个词汇:
训练与推理。
许多人常将二者混淆。
“把公司文档发给 AI,是否意味着它被训练了?”
通常并非如此。
日常使用 AI 时,大多是在进行推理。
推理即:
向已训练好的模型提供输入,使其生成结果。
例如你问:
模型依据当前输入生成总结,这便是推理。
而训练则是:
利用海量数据调整模型参数,使模型获得或改变某种能力。
训练通常成本高昂、流程复杂,需大量数据与算力支持。
你在聊天框中发送资料,并不等于模型被重新训练。
它仅在本次回答中参考了这段资料。
更换对话、工具或环境后,它未必知晓。
它既非汉字,也不完全等同于英文单词。
你可先将 Token 理解为:
模型处理文本时的基本计量单位。
模型并非直接按“人类看到的字数”运作。
输入模型前,文本通常会被切分为若干小段 Token。
有时一个中文词可能对应一个或多个 Token。
有时一个英文单词会被拆分为多个 Token。
因此 Token 与字数并非一回事。
那为何 Token 如此重要?
因为它关联诸多现实问题:
许多 AI API 的定价也是按 Token 计算。
输入内容消耗 Token,输出内容同样消耗 Token。
让 AI 阅读整本书与阅读一段话,成本与速度截然不同。
简言之:
上下文即模型在回答前能获取的信息。
它可能包含:
模型生成回答时,并非凭空捏造,而是基于当前上下文进行。
但新手极易犯一个错误:
上下文并非永久记忆。
你在一次对话中告知 AI 某事,它能利用,是因为此事仍在当前上下文中,这不代表模型本身被修改,也不代表下次它一定记得。
上下文更像是本次考试发给模型的一张资料纸。
资料纸上有什么,它便能参考什么。
资料纸上没有的,它只能依赖模型原有能力及当前输入去推断。
因此你会观察到一种现象:
同一 AI 在同一对话中越聊越懂你。
但开启新对话时,它又像重新认识你一般。
这并非它“变笨了”,只因上下文发生了变化。
理解上下文后,再看上下文窗口便简单了。
上下文窗口即:
模型单次最多能处理的上下文数量。
若模型支持超大上下文窗口,意味着它一次可查看更多内容。
例如更长文档、更多聊天记录、更大代码文件或更多检索结果。
RAG 是 Retrieval-Augmented Generation 的缩写。
中文通常称为检索增强生成。
其流程为:
先检索相关资料,再让模型基于这些资料生成回答。
为何需要 RAG?
因为模型本身不可能永远知晓最新信息。
若直接询问,它可能会猜测,且猜得颇像那么回事。
RAG 的思路是:
不让模型单纯靠记忆作答,而是先从指定资料库中找出相关内容,再将这些内容纳入当前上下文,最后让模型基于这些内容作答。
RAG 的关键在于:
检索到正确资料,并让模型依据资料回答。
缓存的核心思想是:
已处理且可复用的内容,无需重新处理。
举个普通例子:
首次打开网页,浏览器可能需下载大量资源。
再次打开时,若部分资源未变,可直接复用本地缓存。
这样速度更快,也减少网络请求浪费。
AI 中的缓存亦类似。
只不过缓存对象可能不仅是网页资源,还包括某些已处理的上下文、输入片段、计算结果或中间状态。
缓存命中即:
本次请求恰好复用了之前缓存的内容。
缓存未命中即:
本次请求无可复用内容,只能重新处理。
在 AI 场景中,缓存可能影响:
例如你反复让模型处理相同说明、长文档或固定上下文,若平台支持相关缓存机制且命中,可能减少重复处理。
但有一个极重要的点:
缓存并非记忆。
缓存命中不代表模型“认识你”,也不代表模型真正学会了新知识。
它仅是系统复用了之前处理过的某些内容。
所谓幻觉,即:
模型生成看似合理,实则不准确、不存在或无法验证的内容。
它可能编造不存在的接口,或编造听起来专业的解释。
若读者缺乏相关背景,极易被其误导。
为何会有幻觉?
大模型的核心任务并非“查数据返回事实”,而是依据上下文及所学内容,生成最可能的结果。
因此使用 AI 时,需牢记一个原则:
表达流畅不等于事实可靠。
最常见例子:
你是什么模型?
它对自己的身份并无认知,故会出现各种答案,此类问题毫无意义。
模态可理解为信息类型。
常见模态包括:
多模态 AI,即能处理多种信息类型的 AI。
例如:
多模态价值巨大,若 AI 仅能处理文字,其应用范围将受限。
但多模态亦非万能,看图、听音频、读文件同样可能出错,图片中的小字可能识别错误。
点个关注不迷路~