AI 进化史:从规则机器到大语言模型的蜕变之路
导语:
昨日我们探讨了一个核心议题:究竟何为大语言模型?
先来简要复盘:
大语言模型好比一位博览群书的"超级语言天才",它通过吞噬海量文本来掌握语言逻辑,具备写作、摘要、翻译、编程及陪聊等多重技能。
然而,许多人心中或许仍有疑问:
其实早在上世纪 50 年代,科学界便已开启相关思索:
1950 年,英国数学家艾伦·图灵提出了举世闻名的"图灵测试"。
其核心逻辑是:让一名测试者同时与机器及真人进行对话。
若测试者无法分辨哪方是机器、哪方是真人,则该机器可被视为拥有一定智能。
这听起来是否与我们今日同 AI 助手交流的场景如出一辙?
只不过彼时的计算机体积庞大且笨重,计算能力也极为受限。
尽管人们提出了宏大的构想,但要想将其落地,仍需经历漫长的等待。
初期的人工智能,主要依赖人类预先设定的规则体系。
举例而言:
那个阶段的 AI,宛如一名绝对服从的员工。
你为其制定规则,它便严格照章办事。
规则越是详尽,它的表现就越出色。
然而弊端也显而易见:
现实世界错综复杂,单靠人力编写规则根本无法穷尽。
譬如你想让机器解读一句话:
其中的"绝了"二字,究竟是赞扬还是讽刺?
若缺乏语境支撑,机器很难做出准确判断。
因此,早期的规则型 AI 虽在特定任务中奏效,却难以真正读懂复杂的人类语言。
随后,科学家们意识到:
与其逐条编写规则,不如让机器直接从数据中自主学习。
这便是机器学习的诞生。
举个直观的例子:
若我们要让机器识别猫咪。
旧有的方式或许是告诉它:
而机器学习的思路则是:
向机器展示成千上万张猫的图片。
接着再给它看成千上万张非猫的图片。
经过海量训练后,机器会逐渐领悟:
哪些特征属于猫,哪些特征不属于猫。
这一转变至关重要:AI 从"人灌输规则"进化为"它自行从数据中归纳规律"。
这也构成了今日大语言模型得以问世的重要基石。
步入 2010 年后,人工智能迎来了关键转折:深度学习。
深度学习可被视为一种更强劲的机器学习手段。
它汲取了人脑神经网络的灵感,借助层层递进的计算架构来处理复杂信息。
为何这一阶段如此关键?
因为 AI 开始在众多任务上实现突破:
如今我们刷短视频、使用语音输入、浏览电商推荐,背后皆离不开深度学习的支撑。
不过,此阶段的 AI 虽已相当强大,但多数系统仍属于"专才型"。
换言之,某个 AI 可能擅长人脸识别,却不会写文章;
另一个 AI 或许精通翻译,却无法绘图;
它们大多仅能胜任特定任务。
真正让大众深切感受到 AI 冲击的,是近几年兴起的大模型时代。
此处的"大",主要彰显在三个维度:
大模型与过往诸多 AI 最本质的区别在于:
它不再局限于单一固定任务,而是能驾驭多种任务。
例如一个大语言模型可以:
这就好比过去的 AI 是"单项冠军",而大语言模型则更像是"全能型选手"。
它未必在每件事上都臻于完美,但其通用能力显著增强。
现在让我们将目光重新聚焦于"大语言模型"本身。
大语言模型的演进,大体经历了以下几个阶段:
早期机器处理语言时,主要依赖统计学方法。
比如系统会统计:
若大量文本中"我爱你""我爱学习""我爱北京"出现频率极高,系统便会依据概率推测下一个词。
这颇似早期输入法的联想功能。
后来,研究者开始运用神经网络来处理语言。
机器不再单纯统计词频,而是尝试理解词汇间的关联。
例如:
这使得机器对语言的理解迈上了新台阶。
2017 年,人工智能发展史上诞生了一项至关重要的技术:Transformer。
其卓越之处在于,能更高效地理解句子中不同词语间的相互关系。
比如这句话:
这里的"她"指代何人?
人类一眼便知是指小红。
而 Transformer 的优势,正在于更擅长捕捉此类上下文关联。
当今众多主流大语言模型,均与 Transformer 技术息息相关。
随后,人们发现:
可先让模型在海量文本上进行"预训练",使其先掌握通用语言能力。
然后再通过进一步训练,使其更擅长回答问题、遵循指令及与人对话。
这好比一名学生:
先广泛阅读,夯实基础;
再接受专项训练,学会如何应试、如何表达、如何解题。
于是,大语言模型的能力开始飞速提升。
你或许会问:
既然人工智能已研究良久,为何偏偏近几年大语言模型突然爆火?
主要原因有三。
互联网数十年的发展,积淀了海量的文本、图片、代码及视频等数据。
这些数据宛如 AI 的"教材"。
教材越丰富,模型便越有机会习得更多知识与表达方式。
训练大模型需要强大的算力支撑。
过去计算机速度不足,许多构想只能停留于论文之中。
如今 GPU、AI 芯片及云计算迅猛发展,使得大规模训练成为现实。
Transformer、预训练、指令微调、人类反馈强化学习等方法,令模型不仅能"接话",还能更精准地理解人类意图。
因此,大语言模型的爆发绝非一日之功。
它是数据、算力与算法长期积累后的集中迸发。
若用一句话概括人工智能的发展历程,那便是:
我们可以将其简单梳理为一条主线:
这条道路的背后,是人类不断将知识、数据及计算能力赋予机器,令其逐步学会处理更复杂的难题。
当然,今日的大语言模型并非万能。
它可能会:
但它已然成为人工智能发展史上的一个重要里程碑。
今天我们从人工智能的起源,一路讲述至大语言模型的爆发。
你会发觉,如今的 AI 并非横空出世的奇迹。
其背后蕴含着数十年的技术积淀,也经历了无数次的失败、低谷与突破。
从规则型 AI,到机器学习;
从深度学习,到大语言模型;
AI 的每一次跨越,都在让机器更接近理解人类语言、辅助人类工作的愿景。
但更为关键的是:
未来,善用 AI 的人,或将拥有更强的学习能力、表达能力、创造能力及解决问题的能力。
你初次听闻人工智能,是在何时?
是科幻电影中的机器人,还是如今手机里的 AI 助手?
欢迎在评论区分享你对 AI 的初印象。