AI知识全解析:一文读懂人工智能核心概念
“人工智能真的会取代人类吗?”
“三亿人的工作岌岌可危?AI发展太迅猛!”
“AI即将接管职场?毕业生遭遇就业危机?”
......
关于AI的种种热议,这类消息想必你已司空见惯,或许还因此产生过担忧与紧张情绪。对于刚接触人工智能的新手来说,该领域的知识架构既浩瀚又庞杂,各种专业名词纷至沓来,往往令人眼花缭乱,难以理解。
AI究竟是什么?
AI大模型指的是什么?算力又是何物?
AIGC是什么概念?GPT有哪些含义?
今日就为大家逐一解读
AI,即artificial intelligence的缩写形式。Artificial,不少人望文生义,误以为是艺术(art)的某种派生词。实际上,artificial的含义正是“人造的、非自然的”,与natural(自然的)形成反义关系。Intelligence,这个词相对好认,意为“智能”。知名科技企业英特尔(Intel)的命名,便源自该词的前五个字母。综合而言,AI即“人造的智能”,意指通过人为技术途径,创造出具有智能特性的系统。
针对AI的定义,业界存在多种阐释。较为学理化的一种表述为:AI是一门专注于探究、研发用于模仿、延展及扩充人类智能行为的理论体系、方法路径、技术手段及其应用系统的综合性学科。这个定义颇为艰涩,读来令人费解。实际上,我们可以将AI进行拆解认知:
其一,AI的根本属性属于科学范畴,是一个技术方向。它涵盖了计算机科学、数学、统计学、哲学、心理学等诸多学科的知识要素,但总体隶属于计算机学科体系。
其二,AI的研究宗旨在于使某个“系统”获得智能特性。此处的“系统”,既可以是某套软件应用,也可以是某台计算机设备,乃至某个机器人实体。
其三,达到何种程度方可称为真正的智能,这是核心所在。以当前标准来看,能够如同人类般进行感知、理解、思考、判断及决策,即视为实现了人工智能。若再结合机器人、机械臂等实体装置,AI亦可具备执行操作的能力。
基于上述三个维度的梳理,把握AI的定义便不再困难。
近两年AI之所以备受瞩目,根源在于大模型的崛起。那么,大模型究竟为何物?
大模型,是指具备海量参数规模及复杂运算架构的机器学习模型。(参数,即模型在训练阶段进行学习与调节的变量。参数决定了模型的行为模式、性能表现、实现成本以及对计算资源的需求量。通俗来讲,参数是模型内部用于完成预测或决策的组成部分。)
大模型通常坐拥数百万乃至数十亿级别的参数。与之相对,参数规模较小的即为小模型。针对某些垂直领域或具体场景,小模型亦能满足需求。大模型需依托海量数据实施训练,对算力资源的耗费极为可观。绝大多数大模型的底层核心架构,均为Transformer及其衍生变体。
大模型涵盖多种类型。通常提及的大模型,主要指向语言大模型(基于文本数据训练)。但除此之外,还存在视觉大模型(基于图像数据训练),以及多模态大模型(融合文本与图像数据)。
依据应用场景划分,大模型可分为通用大模型与行业大模型。通用大模型的训练数据集覆盖面更广,涉及的领域更为多元。行业大模型,望文生义,其训练数据源自特定行业,服务于专属领域(诸如金融、医疗、法律、制造业等)。
GPT-1、GPT-2……GPT-4o等,均为美国OpenAI公司陆续推出的语言大模型产品,同样建立在Transformer架构基础之上。
GPT的完整称谓为Generative Pre-trained Transformer,即生成式-预训练-Transformer。Generative(生成式),表明该模型能够产出连贯的、具备逻辑性的文本内容,例如开展对话、编撰故事、撰写代码或创作诗歌等。Pre-trained(预训练),表明该模型会先在一个庞大的未标注文本语料库中开展训练,掌握语言的统计规律及潜在结构。正是经由预训练,模型才具备了一定的通用能力。训练数据的规模越庞大(如网页文本、新闻报道等),模型的能力便越强劲。
公众对AI的高度关注,主要发端于2023年初ChatGPT的 viral 传播。
ChatGPT中的chat,意为交谈、对话。ChatGPT是OpenAI基于GPT模型打造的一款AI对话应用服务(亦可理解为GPT-3.5)。借助这项服务,普通用户得以切身感受GPT模型的卓越性能,有益于技术的普及与推广。事实验证,OpenAI的战略取得了成功。ChatGPT极大地激发了公众的兴趣,也切实推动了AI领域的蓬勃发展浪潮。
AIGC,全称人工智能生成内容(Artificial Intelligence Generated Content)。这项技术意义重大,它凭借 AI 技术,能够自动创作文本、图像、音频、视频等多种形态的内容。环顾当下,那些自动化生成的新闻报道、惟妙惟肖的绘画作品,不少都是 AIGC 的杰作,客观而言,它为内容生产行业引发了一场深刻的变革。
算力即其字面含义,计算能力,计算机执行运算处理的能力,更为精确地说,算力是通过对信息数据进行加工处理,达成目标结果输出的计算效能。通常用以衡量人工智能、区块链、数据分析等场景的计算表现。人工智能领域中的深度学习任务,需要庞大的计算资源来支撑模型的训练与推理过程。因此,算力在该领域的重要性日益凸显。强劲的算力能够缩短训练周期、提升模型的精确度与性能表现,并且应对更为复杂的任务与数据集,最终产出创新性的、原创的内容成果。
在AI领域中,Token通常指代模型处理文本或其他类型数据时的基础单元或构成要素。它是模型理解及处理数据的最小粒度,可以是一个词汇、一个短语、一个标点符号、一个子词或者一个字符等。Token的划分策略会对模型的数据理解与处理效果产生影响。
当前AI的发展进程可划分为三个层级,依次为:弱人工智能阶段、强人工智能阶段、超人工智能阶段。
第一阶段:弱人工智能(Artificial Narrow Intelligence,ANI),亦称狭义人工智能,指的是在特定任务领域展现出与人类相当或超越人类水平的人工智能系统,例如语音识别、图像识别、自然语言处理、无人驾驶等场景。此类人工智能系统虽在特定领域表现优异,但缺乏综合整合与通用迁移能力,无法像人类一样开展复杂的推理判断,不具备人类的完整智能。
第二阶段:强人工智能(Artificial General Intelligence,AGI),亦称通用人工智能,指的是拥有近似人类智能水平的人工智能系统。此类人工智能系统能够如同人类一般开展复杂的推理判断,具备学习、自主适应及创新创造的能力。
第三阶段:超级人工智能(Artificial Super Intelligence,ASI),亦称超人工智能,指的是远超人类智能水平的人工智能系统。此类人工智能系统拥有超出人类认知边界的智慧和能力,可以完成人类难以想象的复杂任务,可能具备独立的意识与目标追求,能够自主学习和迭代进化,甚至超越人类的管控和认知范畴。超人工智能的发展走向及其影响尚属未知领域。
现阶段的人工智能已接近强人工智能的水准。展望未来,它将持续演进为超人工智能,深度融入我们的日常起居,届时我们将把众多工作任务及应用场景交由AI处理,以期其创造更为丰厚的价值。