标签

解密AI:人工智能的ABC

发布时间:2026-05-07 23:13来源:微信阅读:5

你是否也曾经历过这样的瞬间:朋友自豪地展示"我用AI完成了策划案",而你却在想"AI究竟是什么"?或者听到"机器学习"、"深度学习"、"大模型"、"Tokens"这些流行词汇,每个字都认识,但连在一起就有些费解。

今天我们就用最通俗易懂的方式,把人工智能(AI)的基础知识讲清楚。

阅读完这篇文章,不求深入,你至少能明白三个问题:AI是什么?它如何运作?那些流行术语之间有何关联?

人工智能(Artificial Intelligence,AI),是由约翰·麦卡锡 (John McCarthy) 在 1955 年提出的,并在 1956 年达特茅斯人工智能研究项目会议上公开的。就是让机器模拟人类智能的技术——包括看、听、说、思考、做判断。

就像人类能识别动物、理解笑话、学会骑车一样,人们期望机器也能实现这些功能。只不过,它不依赖生物体,而是依靠数据和算法。

如果只能记住三个词,请记住:AI、ML、DL。

AI,人工智能是最广泛的概念,是一个超过60年的研究领域,任何"使机器具备智慧"的尝试,都属于AI范畴。

ML,(Machine Learning,机器学习) 是实现AI的主要途径。传统编程是人提供规则,机器得出结果;而机器学习是人提供结果(数据),让机器自己找出规则。

DL,(Deep Learning,深度学习) 是机器学习中的一种强大技术,模仿人脑的神经网络结构,处理海量复杂数据。

举个例子:你想教会电脑辨认猫。

传统编程:你编写"如果有尖耳朵、胡须、毛茸茸的身体,就是猫"。

机器学习:你给电脑1万张标记着"是猫/不是猫"的图片,它自己寻找规律。

深度学习:通过多层神经网络学习,它能从像素开始逐步抽象出"眼睛→耳朵→猫脸"的特征。

目前听到的ChatGPT、文心一言等产品,背后都是深度学习技术。

机器学习大致有三种"学习方式":

监督学习——有标准答案。提供大量"问题+答案",让机器学会预测,比如识别苹果,给出几千张标注了苹果的图片,找出苹果的特征。

无监督学习——没有答案,让机器自己发现规律。比如将客户自动分成几个类型,你甚至不知道该分成几类。

强化学习——像训练宠物。做对了给予奖励,做错了进行惩罚。AlphaGo围棋击败李世石,使用的就是强化学习。

通俗地说:监督学习是做题有参考答案,无监督学习是整理分类,强化学习是从错误中学习。

你可能常听到"算力不足"、"消耗了1000个tokens",这又是什么意思?

算力就是计算能力,AI背后是大量的数学运算,需要显卡(GPU)来执行。在AI中通常用 FLOPs(浮点运算次数)或 GPU运行时间来衡量。简单理解就是让显卡执行数学运算的速度和总量。

AI对算力的需求主要来自两个阶段:

① 训练(Training):用海量数据教导模型,需要巨大算力(比如训练一次GPT-4可能花费数千万美元的电费+硬件)。

② 推理(Inference):模型已经训练完成,你向它提问,它生成回答的过程。每次推理需要的算力相对训练小很多,但仍然与处理的Tokens数量成正比。

Token是AI处理文本的最小单位。一个汉字约等于1~2个token,一个英文单词可能被分成0.75个token。AI每读一个字、输出一个字,都在消耗tokens。

算力 与 Tokens 的关系:

处理一个Token所需的总计算量 ≈ 模型参数数量 × 一个常数(大约2)。

假设有一个 70亿参数(7B)的模型(如Llama 2 7B)。

向AI模型提出一个问题,输入是 100 个Tokens。

模型生成回答 200 个Tokens。

总处理的Token数 = 100(输入)+ 200(输出)= 300 Tokens。

大致估算推理这 300 Tokens 需要的浮点运算量:

300 × (2 × 7B) = 300 × 14B = 4.2 × 10¹² 次FLOPs,即约4.2 TFLOPs。

因为很多AI服务(包括API)按Tokens数量收费。我们平时看到的定价通常是:

每千输入Tokens 多少钱,每千输出Tokens多少钱。

例如:

输入 0.0003元/千Tokens

输出 0.0006元/千Tokens

所以写一段2000字的文章(约2700 Tokens),可能花费几分钱。这个价格背后,就是算力的实际消耗。

简单直接地说:算力以电力为"能量来源"。没有电力,任何计算都无法进行;算力需求越大、越密集,消耗的电力就越多。 以当前主流的AI训练/推理显卡为例: 英伟达 H100,功率约700瓦,运行1小时耗电约0.7度,专为AI训练设计。

但实际数据中心里,除了GPU本身,还要加上CPU、内存、散热(空调/液冷)、电源转换损耗。整体数据中心

总功耗 ≈ GPU功耗 × (1.5~2倍)。

所以一块H100满载运行一小时,数据中心整体耗电约 1.0~1.4度。

一个大型AI集群(1万块H100)运行一小时,耗电约 1万~1.4万度。

这还不算训练一个大模型通常需要连续运行几周甚至几个月。例如GPT-3一次训练,估算耗电约 1300万度 – 相当于1300个家庭一年的用电量。

了解AI的基础知识后,其竞争的背后,不仅是算法和数据的较量,更是"能源的竞争"。谁拥有更经济、更可靠的电力资源,谁就能训练更大的模型、服务更多的用户。