标签

从二进制到智能:AI运作机制解析

发布时间:2026-06-09 21:30来源:微信阅读:2

尽管笔者本科、硕士都是EE,但学的其实并不精细,当然回望过去的学习,仍然要感叹道模拟电路、信号与系统、信息论、通信原理、数据结构等课程的伟大与奥妙,他们揭示了世界是如何被计算机所理解并计算的,也试着试图梳理并浅显地写下这篇文章。

一、计算机如何理解0和1

我们平时看到的世界,是文字、图片、声音和视频。

但计算机看到的世界不是这样。

一张图片,在计算机里是像素矩阵;

一段声音,在计算机里是采样后的数字信号;

一篇文章,在计算机里是编码后的数字序列;

一句话输入给大模型,会被拆成一个个token,再变成高维向量。

所以,计算机所谓的“理解”,第一步不是像人一样理解意义,而是先把现实世界变成数字。

而这些数字,归根到底又会变成最基础的两种状态:

0和1,也就是常说的二进制

那为什么计算机偏偏用0和1而不是123456

因为在物理世界里,最容易稳定区分的不是很多种状态,而是两种状态。

比如电路中可以用高电压表示1,低电压表示0;也可以用有电流表示1,没有电流表示0。现实电路会有噪声、波动和误差,如果用十几种电压分别表示不同数字,就很容易混乱。但如果只区分高和低,系统就稳定很多,简单的表述却几乎构建了信息世界的基石。笔者第一次接触模拟电路时不得不感叹模电非常的神奇。

二、晶体管为什么能控制0和1?

如果要用一句话解释晶体管:

晶体管就是一个由电信号控制的微型开关。

普通开关需要人去按,晶体管不需要。它可以用一个很小的电信号,去控制另一条电路是导通还是截止,当然这里面涉及到了非常复杂的术语,比如栅极、源极、漏极,还有截止电流、偏置电压等等。

你可以把它想象成一个电子水龙头。

水龙头打开,水流过去,可以看作1;

水龙头关闭,水流不过去,可以看作0。

在芯片里,这个“水流”就是电流。晶体管的栅极就像水龙头的把手。当栅极电压达到一定条件时,电流可以通过;当条件不满足时,电流被阻断。

于是,一个晶体管就能表达两种状态:开或者关,1或者0。

单个晶体管当然不会思考。但当数十亿、数百亿个晶体管被设计成复杂电路之后,它们就可以组成逻辑门、存储器、处理器和各种计算单元,本质上内存也是一种半导体器件。

与门、或门、非门这些逻辑结构,本质上就是一组组晶体管的组合。

再往上,逻辑门组成加法器;加法器组成运算单元;运算单元和控制单元组成CPU、GPU等等。

三、从芯片到AI:智能是怎么被“算”出来的?

人工智能并不是从一开始就像今天这样会聊天、会画图、会写代码。

早期人工智能更多是规则系统。人类专家把经验写成规则,机器按照规则执行。比如:

如果温度超过某个值,就报警;

如果图像里某些特征满足条件,就判断为某个物体;

如果用户输入某些关键词,就返回固定答案。

这就是最初级的人工智能也算自动化吧

后来机器学习出现了。机器不再完全依赖人工写规则,而是从大量数据中学习规律。机器学习的最大特点就是可推导,笔者读研的时候手推过很多机器学习经典公式如svm、lda、随机森林等等。

再后来,深度学习兴起。神经网络可以通过多层结构,从数据中提取越来越复杂的特征。本质上,神经网络是一种拟合。

到了今天的大模型时代,核心变化是:

模型规模变大了,数据规模变大了,算力规模也变大了。

大模型并不是一个简单的问答库。它的工作方式更像是在巨大的参数空间里,根据上下文计算概率分布,然后预测下一个最可能出现的内容。

你问它一个问题,文本会被变成向量,向量进入神经网络,经过一层又一层计算,不断推导下一个最有可能的输出,最终生成答案。

这背后最核心的计算,就是大量矩阵乘法、向量运算和数据搬运。

这也就是目前为什么内存、GPU、CPU、光很火热。本质上,CPU负责任务调度与拆解,GPU负责计算、而内存则决定了多少数据同时参与计算、光则负责海量计算内容在不同的GPU中的传输。

四、为什么以前没有爆发这样的AI需求?

人工智能并不是最近才被发明的。

正如前文所说,早在几十年前,人工智能的概念就已经出现了。神经网络、机器学习、专家系统,也都不是新鲜东西。

那为什么直到最近几年,AI才真正爆发?

核心原因有三个:数据、算法和算力,终于在同一时间成熟了。

第一,数据足够多了。

互联网、移动互联网、短视频、社交媒体、搜索引擎、电商、工业系统,积累了海量文本、图片、语音、视频和行为数据。

没有数据,模型就没有学习材料。

第二,算法更成熟了。

深度学习、Transformer架构、自监督学习、强化学习,让模型可以从海量数据中学习更通用的能力。

尤其是Transformer架构,使模型可以更好地处理长文本和上下文关系,成为大语言模型的重要基础。

第三,也是最关键的,算力终于跟上了。

过去不是大家不想做大模型,而是算不起、跑不动、存不下。

训练一个大模型,需要海量并行计算。CPU适合通用任务,但面对大规模矩阵运算效率不够高。GPU天然适合并行计算,因此成为AI训练和推理的重要基础。

同时,HBM高带宽内存、先进封装、高速网络、数据中心电源和散热系统也在一起进步。

可以说:

计算的需求一直存在,但缺的是足够便宜、足够强大、足够规模化的算力。

五、如何进一步指导我们的投资

首先是算力芯片。

GPU、AI加速器、ASIC、NPU,是AI时代最核心的计算引擎。无论是训练大模型,还是在云端进行大规模推理,都离不开高性能计算芯片。

其次是存储芯片。

大模型不仅要“算得快”,还要供得上数据。如果数据搬运速度跟不上,计算单元就会等待,性能无法充分释放。

这也是为什么HBM高带宽内存变得如此重要。AI不是只需要更强的计算,也需要更快的存储和更高的数据带宽。

第三是先进封装。

当单颗芯片继续提升性能越来越困难,先进封装就变得关键。Chiplet、2.5D封装、3D封装,可以把计算芯片、存储芯片和其他模块更高效地连接在一起,提高系统性能。

第四是半导体设备和材料。

芯片不是凭空制造出来的。先进制程需要光刻、刻蚀、薄膜沉积、离子注入、清洗、检测等设备,也需要硅片、光刻胶、电子特气、靶材、封装材料等上游支撑。

Gartner在2026年4月的预测中则认为,全球半导体收入将在2026年超过1.3万亿美元,AI处理、数据中心网络、电源和存储需求是重要推动因素。

笔者昨天说了投资a股的6个利好,那么投资半导体,也有三个长期变量。

第一,投算力需求的增长。

模型越来越大,推理调用越来越多,AI应用越来越普及,算力需求会持续增长。未来还会向物理ai包括但不限于机器人演进

第二,投数据搬运效率的提升。

未来计算瓶颈不只在计算单元本身,也在存储、带宽、互连和封装。谁能让数据更快、更低功耗地流动,谁就拥有关键价值。

第三,投国产化和产业链安全。

半导体是现代科技产业的基础,也是全球科技竞争的核心领域。无论从AI、汽车、通信、工业控制,还是从供应链安全角度看,半导体都具有长期战略价值。

最后有一点想强调一下,AI到底是不是一种拟合,是不是一种准确度很高的猜测,可能没有那么重要。因为,人的行为究竟可不可以被预测呢?笔者认为,一定程度上,每个人的下一秒的状态同样可以被预测,累了想睡觉,开心了想说话,口渴了就喝水,本质上人也是一种被编程的生物,只是这种编程看起来的输出非常多样,误以为他具有很高的灵性。

有时候人和人的差异在哪?其实可能在神经元的数量和参数上

仔细思考,这其实是一个很有深度的问题。