解密AI：人工智能的ABC

发布时间：2026-05-07 23:13阅读：18

你是否也曾经历过这样的瞬间：朋友自豪地展示"我用AI完成了策划案"，而你却在想"AI究竟是什么"？或者听到"机器学习"、"深度学习"、"大模型"、"Tokens"这些流行词汇，每个字都认识，但连在一起就有些费解。

今天我们就用最通俗易懂的方式，把人工智能（AI）的基础知识讲清楚。

阅读完这篇文章，不求深入，你至少能明白三个问题：AI是什么？它如何运作？那些流行术语之间有何关联？

人工智能（Artificial Intelligence，AI），是由约翰·麦卡锡 (John McCarthy) 在 1955 年提出的，并在 1956 年达特茅斯人工智能研究项目会议上公开的。就是让机器模拟人类智能的技术——包括看、听、说、思考、做判断。

就像人类能识别动物、理解笑话、学会骑车一样，人们期望机器也能实现这些功能。只不过，它不依赖生物体，而是依靠数据和算法。

如果只能记住三个词，请记住：AI、ML、DL。

AI，人工智能是最广泛的概念，是一个超过60年的研究领域，任何"使机器具备智慧"的尝试，都属于AI范畴。

ML，（Machine Learning，机器学习）是实现AI的主要途径。传统编程是人提供规则，机器得出结果；而机器学习是人提供结果（数据），让机器自己找出规则。

DL，（Deep Learning，深度学习）是机器学习中的一种强大技术，模仿人脑的神经网络结构，处理海量复杂数据。

举个例子：你想教会电脑辨认猫。

传统编程：你编写"如果有尖耳朵、胡须、毛茸茸的身体，就是猫"。

机器学习：你给电脑1万张标记着"是猫/不是猫"的图片，它自己寻找规律。

深度学习：通过多层神经网络学习，它能从像素开始逐步抽象出"眼睛→耳朵→猫脸"的特征。

目前听到的ChatGPT、文心一言等产品，背后都是深度学习技术。

机器学习大致有三种"学习方式"：

监督学习——有标准答案。提供大量"问题+答案"，让机器学会预测，比如识别苹果，给出几千张标注了苹果的图片，找出苹果的特征。

无监督学习——没有答案，让机器自己发现规律。比如将客户自动分成几个类型，你甚至不知道该分成几类。

强化学习——像训练宠物。做对了给予奖励，做错了进行惩罚。AlphaGo围棋击败李世石，使用的就是强化学习。

通俗地说：监督学习是做题有参考答案，无监督学习是整理分类，强化学习是从错误中学习。

你可能常听到"算力不足"、"消耗了1000个tokens"，这又是什么意思？

算力就是计算能力，AI背后是大量的数学运算，需要显卡（GPU）来执行。在AI中通常用 FLOPs（浮点运算次数）或 GPU运行时间来衡量。简单理解就是让显卡执行数学运算的速度和总量。

AI对算力的需求主要来自两个阶段：

① 训练（Training）：用海量数据教导模型，需要巨大算力（比如训练一次GPT-4可能花费数千万美元的电费+硬件）。

② 推理（Inference）：模型已经训练完成，你向它提问，它生成回答的过程。每次推理需要的算力相对训练小很多，但仍然与处理的Tokens数量成正比。

Token是AI处理文本的最小单位。一个汉字约等于1~2个token，一个英文单词可能被分成0.75个token。AI每读一个字、输出一个字，都在消耗tokens。

算力与 Tokens 的关系：

处理一个Token所需的总计算量 ≈ 模型参数数量 × 一个常数（大约2）。

假设有一个 70亿参数（7B）的模型（如Llama 2 7B）。

向AI模型提出一个问题，输入是 100 个Tokens。

模型生成回答 200 个Tokens。

总处理的Token数 = 100（输入）+ 200（输出）= 300 Tokens。

大致估算推理这 300 Tokens 需要的浮点运算量：

300 × (2 × 7B) = 300 × 14B = 4.2 × 10¹² 次FLOPs，即约4.2 TFLOPs。

因为很多AI服务（包括API）按Tokens数量收费。我们平时看到的定价通常是：

每千输入Tokens 多少钱，每千输出Tokens多少钱。

例如：

输入 0.0003元/千Tokens

输出 0.0006元/千Tokens

所以写一段2000字的文章（约2700 Tokens），可能花费几分钱。这个价格背后，就是算力的实际消耗。

简单直接地说：算力以电力为"能量来源"。没有电力，任何计算都无法进行；算力需求越大、越密集，消耗的电力就越多。以当前主流的AI训练/推理显卡为例：英伟达 H100，功率约700瓦，运行1小时耗电约0.7度，专为AI训练设计。

但实际数据中心里，除了GPU本身，还要加上CPU、内存、散热（空调/液冷）、电源转换损耗。整体数据中心

总功耗 ≈ GPU功耗 × (1.5~2倍)。

所以一块H100满载运行一小时，数据中心整体耗电约 1.0~1.4度。

一个大型AI集群（1万块H100）运行一小时，耗电约 1万~1.4万度。

这还不算训练一个大模型通常需要连续运行几周甚至几个月。例如GPT-3一次训练，估算耗电约 1300万度 – 相当于1300个家庭一年的用电量。

了解AI的基础知识后，其竞争的背后，不仅是算法和数据的较量，更是"能源的竞争"。谁拥有更经济、更可靠的电力资源，谁就能训练更大的模型、服务更多的用户。