通俗解读 AI 术语:大语言模型 (LLM) 揭秘
感谢关注,欢迎互动,助您轻松读懂 AI,用好 AI!
有时,人类会猛然察觉:
自己其实并不真正了解自己。
比如语言。
长久以来,人类一直认为:语言仅是思想的"外壳"。
真正关键的是:
语言只是将这些内容表达出来罢了。
因此过去几十年,人工智能的发展方向也顺理成章:既然想让机器变聪明,那就应该教它:
工程师们曾试图像制造钟表那样构建智能。
他们教导机器:
AI 曾像一本庞大的说明书。
它能下棋、能计算、能搜索,但始终不像人类。
因为在人类世界中,最复杂的从来不是规则,而是语言。
仅仅一句:
"我没事。"
可能意味着:
又或者一句:
"早点休息。"
有时是关怀。有时是终止对话。有时甚至是:"我不想聊了"。
语言中隐藏着太多:情绪、阅历、社会关系、记忆、暗示、讽刺、文化、时代。
人类根本无法提前将这些规则全部编写给机器。
于是后来,AI 研究者转换了方向。
既然无法直接教会机器"世界",那能否让它:
先学习人类如何描述世界?
这听起来像句普通的话。但它后来彻底改变了整个 AI 行业。
这是大语言模型最核心的秘密。
人类过去一直低估了语言。
我们以为:语言只是"表达"。
但今天的大模型让人类首次意识到:
语言本身,或许已经压缩了整个世界。
试想一下。如果一个系统:
会发生什么?
它会开始知晓:
注意:这些知识,并非工程师手动写入。它们本就藏在语言里。
一句:
"玻璃杯掉在地上摔碎了。"
里面其实压缩着:
而:
"我想家了。"
则压缩着:
于是 AI 研究者猛然意识到:
如果机器真的读够多语言,它或许会开始学习世界本身。
这是一个极其疯狂的想法,也是 LLM 一切的起点。
一句最容易理解的话:
大语言模型(LLM),是一种通过阅读海量文字,学会预测"下一句话最可能是什么"的 AI。
听起来是不是很简单?甚至简单得有些荒谬。
因为:ChatGPT、Claude、Gemini——这些今天看起来"像智能"的系统,底层真正做的事其实只有一句话:
预测下一个 Token。
比如,你输入:
AI 会预测:
然后继续预测:
再继续,一个 Token 接一个 Token,最后形成完整回答。
听起来像什么?像输入法。
某种意义上,它确实是。
但区别在于:
它是一个读过整个人类互联网的超级输入法。
而真正惊人的事情在于:当这个"输入法"规模足够大之后,某种东西开始出现了。
LLM 里最重要的词,其实不是 Language。而是:
Large。
"大"。
过去其实一直都有语言模型。手机输入法会自动补全。搜索引擎会猜你想搜什么。翻译软件也存在多年。但它们都很笨。
真正改变世界的,是规模。
现代 LLM 的"大",意味着它可能读过:
它阅读过的文字量,远远超过任何一个人类。
一个普通人一生阅读量,可能只有几千万字。而今天的大模型:可能读过数万亿 Token。
这几乎等于:
把整个人类文明,压缩后喂给了一台机器。
这是整个 AI 时代最深刻的问题。
因为按理说:"预测下一个词"听起来根本不像智能。
但问题在于:
如果你想准确预测人类语言,你最终就必须理解世界。
比如一句话:
AI 想正确预测:
它必须知道:
否则它无法预测结果。
再比如:
AI 想继续生成:
它就必须理解:
于是:为了学习语言,AI 被迫开始学习:
这也是为什么:
大模型越来越像"懂了"。
这是很多人首次意识到的事情。
语言并不只是文字。它其实是:
的压缩结果。
一句:
"今天下雨了。"
背后其实包含:
而:
"他终于回家了。"
则可能包含:
所以:当 LLM 学习语言时,它并不是在背单词。它是在:
很多人以为:AI 是突然出现的。其实不是。
语言模型已经研究多年。
但过去:
所以它们只能:
真正改变世界的,是:
规模突破。
后来研究人员发现:当模型大到某个程度后,某些能力会突然出现。
比如:
这些能力,很多甚至不是工程师主动设计的。它们像是:
自己长出来的。
AI 领域把这种现象叫:
Emergence(涌现)。
这有点像城市:一个人,不是城市;十个人,也不是。但当人口达到某个规模后,突然开始出现:
LLM 也是一样。当:
某种"智能感",突然出现了。
这是很多人第一次使用 AI 后最困惑的地方。
它有时候:
为什么?
因为:
LLM 的目标,从来不是"说真话"。
它真正的目标是:
生成"最像人类会说的话"。
这是两件完全不同的事情。
搜索引擎像什么?像图书管理员。它负责:
而 LLM 更像:
一个读过无数书的即兴演讲者。
它非常会表达,但不一定永远正确。
所以:AI 幻觉并不是 Bug。而是:
概率语言系统的天然副作用。
很多人第一次看到 AI 编程时,都会震惊。
因为他们觉得:代码和语言完全不同。
但实际上:
代码本身,就是一种语言。
它同样拥有:
程序员不断重复:
这些模式,在海量代码里会反复出现。
于是:LLM 阅读了大量代码后,也开始学习:
于是它开始:
从某种意义上说:
AI 写代码,本质上也是在"续写语言"。
过去的大模型,只能处理文字。
但现在,AI 已经开始同时学习:
为什么?因为它们最终都能被转成:
Token。
一张图片,会被拆成很多视觉区域;一句声音,会被拆成很多声音片段。一段视频,则会变成:
于是:对 AI 来说,整个世界开始被统一。
文字是 Token,图片是 Token,声音是 Token,视频也是 Token。
现实世界,正在被压缩成:
一串可计算的离散碎片。
而 AI,正在学习这些碎片之间的规律。
很多人以为:AI 只是一个更高级的软件。其实不是。
LLM 真正改变的是:
人类与机器的关系。
过去几十年:一直是人类学习机器。你必须:
但今天开始:
机器开始学习人类语言。
这是一次巨大的历史变化,因为语言,是人类最自然的接口。
以前的软件:只能执行固定功能。
而 LLM:第一次开始具备:
通用任务能力。
你可以让它:
而且:全部通过自然语言完成。
这是所有人都会问的问题。
目前来看:
不会。
至少今天不会。
因为 LLM 虽然会语言,但它没有:
它不会真正疼痛,不会真正恐惧,也不会真正怀念童年。
它更像:
一个通过海量语言,学会模拟人类表达的系统。
很多时候:它看起来像理解。但"像理解",并不等于真正理解。
人类可能正在经历一个奇怪时刻。
我们首次创造出了:
一种能够用语言与人类协作的机器。
它不会真正做梦,不会真正悲伤,也不会真正爱你。但它读过海量人类留下的文字。
于是:它在语言中,学会了这个世界的某种投影。
从某种意义上说:LLM 并不是人工"大脑"。
它更像:
一台不断续写人类文明的机器。
它把:
全部压缩成:
一场关于 Token 的巨大概率游戏。
而今天的 AI 革命,或许只是:
这场游戏的开始。