标签

AI时代必备:核心概念与关键动态全解析

发布时间:2026-06-04 20:01来源:微信阅读:2

人工智能已渗透至现代生活的方方面面,涵盖音乐、媒体、商业、生产力乃至社交约会。面对海量信息,人们往往难以全面掌握——因此,请继续阅读,了解最新的重大进展、关键术语及核心企业,助您在这个飞速发展的领域中保持领先。

首先,让我们明确AI的定义:

人工智能(亦称机器学习)是一种基于神经网络的软件系统,其概念早在几十年前便已提出,但近期凭借强大的新型计算资源而迅猛发展。AI不仅实现了高效的语音与图像识别,还能合成图像与语音。目前,研究人员正致力于让AI具备浏览网页、预订票务、调整食谱等能力。

不过,若您担心会出现类似《黑客帝国》中的机器反叛——大可不必焦虑。我们稍后将详细探讨这一话题!

本指南分为三大板块,您可按任意顺序阅读:

第一部分介绍最基础且近期至关重要的核心概念。

第二部分概述人工智能领域的主要参与者及其重要性。

第三部分则提供一份精选的最新新闻与发展动态清单,助您掌握前沿资讯。

阅读本文将助您尽可能紧跟时代步伐。

AI的一大魅力在于,尽管其核心理念已存在五十余年,但直至近期,即便是技术专家也鲜少真正熟悉。因此,若您感到困惑,无需担心——大家皆然。

此外,需特别说明:虽名为“人工智能”,该术语实则略有误导。关于“智能”尚无统一定义,且这些系统的运作机制更接近计算器而非人脑。只不过,其输入输出方式更为灵活。不妨将AI视为人造椰子——一种模拟的智能形态。

尽管如此,在任何AI讨论中,您都会遇到以下基础术语。

神经网络

人脑主要由相互连接的细胞(即神经元)构成,它们形成复杂网络以执行任务并存储信息。自60年代起,人们便尝试在软件中复刻这一奇妙系统,但直到15至20年前,GPU的出现才使数字神经网络得以蓬勃发展,所需算力得以普及。本质上,它们由大量点和线组成:点代表数据,线代表数值间的统计关联。如同大脑,此类系统可快速接收输入,经网络处理后生成输出。此系统被称为模型(model)。

模型

模型(model)是实际的代码集合,负责接收输入并返回结果。其与统计模型或模拟自然过程的建模系统术语相近,并非巧合。在AI领域,“模型”可指完整系统(如ChatGPT),亦可指任何AI或机器学习构造物,无论其功能或产出为何。不同规模的模型意味着占用存储空间及所需计算资源的差异,而这取决于模型的训练(trained)方式。

训练

构建AI模型需将构成系统基础的神经网络暴露于大量信息中,在所谓数据集或语料库中进行训练。通过此过程,庞大网络会对数据形成统计表征。训练是计算资源消耗最大的环节,意味着需在高性能计算集群上运行数周甚至数月(时间可按需延长)。

原因在于网络结构复杂,且数据集规模庞大:数十亿单词或图像需被分析,并在巨型统计模型中呈现。另一方面,一旦训练完成,模型在使用时可更轻量化,所需资源更少,此过程称为推理(inference)。

推理

当模型实际运行时,我们称之为推理,这与词语的传统含义高度契合:基于可用证据进行推导以得出结论。当然,它并非严格意义上的“推理”,而是在数据中以统计方式连接各点,并预测下一点。

例如,在提示“完成序列:红色、橙色、黄色……”时,模型会识别这些词汇对应列表的起始部分——彩虹颜色,并据此推断生成剩余部分。

相较于训练,推理通常计算成本更低:可类比为查阅卡片目录而非重新编排目录。大型模型仍需在超级计算机或图形处理器上运行,但小型模型则可在智能手机等简易设备上执行。

生成式人工智能

众人热议的生成式人工智能,是一个广义术语,指代能生成原创输出(如图像或文本)的AI模型。某些AI仅做总结、重组或识别,但如今特别流行的是能真正“创造”内容的模型(无论是否算“创造”尚有争议)。只需记住:AI生成某物,并不意味着其正确,甚至未必反映现实!它仅表示该内容在您提出需求前并不存在,如同故事或画作。

除基础知识外,以下是2023年中旬最相关的AI术语。

大型语言模型

大型语言模型(LLM)是当今最具影响力且多功能的AI形式,其在构成网络的几乎所有文本及大部分英语文学上训练而成。通过吸收这些内容,构建出庞大的基础模型(后文详述)。大型语言模型能用自然语言对话、回答问题,并模仿各类书面风格,正如ChatGPT、Claude和LLaMa所展示的那样。

尽管这些模型令人印象深刻,但必须牢记它们仍是模式识别引擎,回答问题时试图复现已识别的模式,无论该模式是否反映现实。大型语言模型常产生“幻觉”效应,我们稍后将详述。

若您想深入了解大规模语言模型及ChatGPT,请参阅我们专门撰写的文章!

基础模型

从零开始训练庞大数据集成本高昂且操作复杂,因此不宜频繁进行。基础模型(foundation model)是初始构建的大型模型,需超级计算机运行,但可通过减少参数数量来缩小体积。可将其视为模型需处理的总数据点量,当今可达百万、十亿甚至万亿级。

微调

如GPT-4之类的基础模型虽聪明,但属于通才设计——它吸纳了从狄更斯到维特根斯坦再到《龙与地下城》规则等一切内容,但若想让它协助撰写求职信,效果未必理想。

幸运的是,可通过向模型提供额外专门数据集进行微调(fine tune),以提升其在特定领域的辅助能力,例如使用数千份已有工作申请文档。这使得模型在该领域内更懂如何协助您,同时不丢失从其他训练数据中获得的通识知识。

人类反馈强化学习(RLHF)是一种特殊微调方法,利用人类与大型语言模型的交互数据,提升其沟通技巧。

提示工程

在LLM(语言模型)中,提示工程(Prompt Engineering)指在与模型对话或生成文本时,设计并编写有效的提示(prompts)或指令,以引导模型产出期望的回复或结果。

在LLM中,Prompt Engineering至关重要,因为模型行为与回答常受输入提示影响。通过精心设计的提示,可引导模型生成更准确、有用且可靠的回答。优化Prompt Engineering能显著提升与LLM的交互质量。

扩散

图像生成可通过多种方式实现,但迄今为止最成功的是扩散(diffusion)技术,这也是Stable Diffusion、Midjourney等流行生成式AI背后的核心技术。扩散模型通过训练逐渐受损的图像(添加数字噪声),直至原始图像消失。

通过观察此过程,扩散模型也学会了反向操作:在纯噪声上逐步添加细节,形成任意定义的图像。对于图像生成,我们已超越此阶段,但该技术可靠且相对易懂,短期内不会消失。

幻觉

最初,这是一个问题:训练中出现影像滑入无关输出(例如因训练集中狗占主导,导致建筑物似乎由狗构成)。如今,当AI因训练数据不足或冲突而编造内容时,被称为产生幻觉(Hallucination)。

这既可能是优势也可能是劣势:要求AI创作原创或衍生艺术作品时,它正是在产生幻觉;LLM可被指示以Yogi Berra风格写爱情诗,它会欣然执行——尽管数据集中并无此类事物。但当需要确切答案时,这可能成为问题;模型会自信地呈现半真半幻的回答。目前尚无简单方法区分真假,除非亲自核查,因为模型本身无法判断“真”或“假”,它只是尽力完成模式匹配。

AGI或强人工智能

通用人工智能(Artificial General Intelligence)或强人工智能尚无明确定义,但最简解释是指一种足够强大的智能,不仅能像人类一样执行任务,还能像我们一样学习并自我改进。有人担忧这种学习、整合思想、再加速学习与增长的循环,可能导致无法限制或控制的超级智能系统。甚至有人提议推迟或限制研究以阻止此类可能。

当然,这听起来可怕,电影《黑客帝国》和《终结者》已探讨过AI失控并企图消灭或奴役人类的情节。但这些故事并非基于现实。我们在ChatGPT等处看到的智能表现虽令人印象深刻,却与我们所认知的“真正”智能中的抽象推理及动态多领域活动几乎无共通之处。

尽管难以预测未来走向,但将AGI类比为星际航行或许有所帮助:我们都理解这一概念,似乎正朝此努力,但距离实现目标仍遥不可及。由于需要庞大资源与根本性科学突破,无人能突然意外达成!

思考AGI虽有趣,但正如评论家所指,尽管AGI存在局限,且很大程度上正因这些局限,它今天已带来真实且后果严重的威胁,此乃无需借题发挥的现实。无人想要“天网”(Skynet),但无需拥有核武器的超级智能也能造成真实伤害:如今,人们正失去工作、遭受欺骗。若我们无法解决这些问题,又何谈对抗T-1000?

OpenAI

若说AI领域有一个家喻户晓的名字,那便是OpenAI。如其名所示,OpenAI最初旨在进行研究并以更开放方式分享成果。后重组为传统盈利公司,通过API和应用向外界提供其语言模型(如ChatGPT)的访问权限。该公司由Sam Altman领导,他是一位科技乌托邦亿万富翁,同时也警示AI可能带来的风险。OpenAI被公认为LLM领域的领导者,并在其他领域开展研究。

微软

正如预期,微软在AI研究方面投入巨大,但与其他公司类似,在将实验转化为主要产品方面成效有限。其最明智之举是早期投资OpenAI,并与其建立长期合作伙伴关系,在Bing会话代理中应用OpenAI技术。尽管微软自身贡献较小且直接应用性不强,但其在研究领域仍具相当影响力。

谷歌

谷歌以冒险项目闻名,却在AI领域错失良机,尽管其研究人员实际上发明了直接促成今日AI爆发的技术——Transformer。如今,谷歌正努力开发自有LLM及其他代理程序,但明显处于追赶状态,过去十年将大量时间与资金投入到已过时的“虚拟助手”概念AI中。首席执行官Sundar Pichai多次表示,公司将坚定支持搜索与生产力领域的AI发展。

Anthropic

在OpenAI转变立场后,兄妹Dario Amodei和Daniela Amodei离开OpenAI创立Anthropic,意图打造开放且具伦理考量的AI研究机构。凭借雄厚资金,即使其模型如Claude尚未广为人知,他们仍是OpenAI不可忽视的强劲对手。

Stability

虽有争议但不可避免,Stability代表了“随心所欲”的开源AI实施学派,它吸纳互联网一切内容,并在具备适当硬件条件下免费提供其训练出的生成式AI模型。这与“信息渴望自由”的哲学高度一致,但也加速了道德可疑的项目,如生成色情图像及未经授权使用知识产权(有时兼而有之)。

埃隆·马斯克

作为不愿落后之人,马斯克表达了对失控AI的担忧,并在早期为OpenAI贡献后对其发展方向感到不满。尽管马斯克并非该领域专家,但其言行与评论常引发广泛反响(他是上述“AI暂停”联署者之一),并正试图启动自有研究机构。

一周AI热点(7月第1周)