从二进制到智能：AI运作机制解析

发布时间：2026-06-09 21:30阅读：9

尽管笔者本科、硕士都是EE，但学的其实并不精细，当然回望过去的学习，仍然要感叹道模拟电路、信号与系统、信息论、通信原理、数据结构等课程的伟大与奥妙，他们揭示了世界是如何被计算机所理解并计算的，也试着试图梳理并浅显地写下这篇文章。

一、计算机如何理解0和1

我们平时看到的世界，是文字、图片、声音和视频。

但计算机看到的世界不是这样。

一张图片，在计算机里是像素矩阵；

一段声音，在计算机里是采样后的数字信号；

一篇文章，在计算机里是编码后的数字序列；

一句话输入给大模型，会被拆成一个个token，再变成高维向量。

所以，计算机所谓的“理解”，第一步不是像人一样理解意义，而是先把现实世界变成数字。

而这些数字，归根到底又会变成最基础的两种状态：

0和1，也就是常说的二进制

那为什么计算机偏偏用0和1而不是123456

因为在物理世界里，最容易稳定区分的不是很多种状态，而是两种状态。

比如电路中可以用高电压表示1，低电压表示0；也可以用有电流表示1，没有电流表示0。现实电路会有噪声、波动和误差，如果用十几种电压分别表示不同数字，就很容易混乱。但如果只区分高和低，系统就稳定很多，简单的表述却几乎构建了信息世界的基石。笔者第一次接触模拟电路时不得不感叹模电非常的神奇。

二、晶体管为什么能控制0和1？

如果要用一句话解释晶体管：

晶体管就是一个由电信号控制的微型开关。

普通开关需要人去按，晶体管不需要。它可以用一个很小的电信号，去控制另一条电路是导通还是截止，当然这里面涉及到了非常复杂的术语，比如栅极、源极、漏极，还有截止电流、偏置电压等等。

你可以把它想象成一个电子水龙头。

水龙头打开，水流过去，可以看作1；

水龙头关闭，水流不过去，可以看作0。

在芯片里，这个“水流”就是电流。晶体管的栅极就像水龙头的把手。当栅极电压达到一定条件时，电流可以通过；当条件不满足时，电流被阻断。

于是，一个晶体管就能表达两种状态：开或者关，1或者0。

单个晶体管当然不会思考。但当数十亿、数百亿个晶体管被设计成复杂电路之后，它们就可以组成逻辑门、存储器、处理器和各种计算单元，本质上内存也是一种半导体器件。

与门、或门、非门这些逻辑结构，本质上就是一组组晶体管的组合。

再往上，逻辑门组成加法器；加法器组成运算单元；运算单元和控制单元组成CPU、GPU等等。

三、从芯片到AI：智能是怎么被“算”出来的？

人工智能并不是从一开始就像今天这样会聊天、会画图、会写代码。

早期人工智能更多是规则系统。人类专家把经验写成规则，机器按照规则执行。比如：

如果温度超过某个值，就报警；

如果图像里某些特征满足条件，就判断为某个物体；

如果用户输入某些关键词，就返回固定答案。

这就是最初级的人工智能也算自动化吧

后来机器学习出现了。机器不再完全依赖人工写规则，而是从大量数据中学习规律。机器学习的最大特点就是可推导，笔者读研的时候手推过很多机器学习经典公式如svm、lda、随机森林等等。

再后来，深度学习兴起。神经网络可以通过多层结构，从数据中提取越来越复杂的特征。本质上，神经网络是一种拟合。

到了今天的大模型时代，核心变化是：

模型规模变大了，数据规模变大了，算力规模也变大了。

大模型并不是一个简单的问答库。它的工作方式更像是在巨大的参数空间里，根据上下文计算概率分布，然后预测下一个最可能出现的内容。

你问它一个问题，文本会被变成向量，向量进入神经网络，经过一层又一层计算，不断推导下一个最有可能的输出，最终生成答案。

这背后最核心的计算，就是大量矩阵乘法、向量运算和数据搬运。

这也就是目前为什么内存、GPU、CPU、光很火热。本质上，CPU负责任务调度与拆解，GPU负责计算、而内存则决定了多少数据同时参与计算、光则负责海量计算内容在不同的GPU中的传输。

四、为什么以前没有爆发这样的AI需求？

人工智能并不是最近才被发明的。

正如前文所说，早在几十年前，人工智能的概念就已经出现了。神经网络、机器学习、专家系统，也都不是新鲜东西。

那为什么直到最近几年，AI才真正爆发？

核心原因有三个：数据、算法和算力，终于在同一时间成熟了。

第一，数据足够多了。

互联网、移动互联网、短视频、社交媒体、搜索引擎、电商、工业系统，积累了海量文本、图片、语音、视频和行为数据。

没有数据，模型就没有学习材料。

第二，算法更成熟了。

深度学习、Transformer架构、自监督学习、强化学习，让模型可以从海量数据中学习更通用的能力。

尤其是Transformer架构，使模型可以更好地处理长文本和上下文关系，成为大语言模型的重要基础。

第三，也是最关键的，算力终于跟上了。

过去不是大家不想做大模型，而是算不起、跑不动、存不下。

训练一个大模型，需要海量并行计算。CPU适合通用任务，但面对大规模矩阵运算效率不够高。GPU天然适合并行计算，因此成为AI训练和推理的重要基础。

同时，HBM高带宽内存、先进封装、高速网络、数据中心电源和散热系统也在一起进步。

可以说：

计算的需求一直存在，但缺的是足够便宜、足够强大、足够规模化的算力。

五、如何进一步指导我们的投资

首先是算力芯片。

GPU、AI加速器、ASIC、NPU，是AI时代最核心的计算引擎。无论是训练大模型，还是在云端进行大规模推理，都离不开高性能计算芯片。

其次是存储芯片。

大模型不仅要“算得快”，还要供得上数据。如果数据搬运速度跟不上，计算单元就会等待，性能无法充分释放。

这也是为什么HBM高带宽内存变得如此重要。AI不是只需要更强的计算，也需要更快的存储和更高的数据带宽。

第三是先进封装。

当单颗芯片继续提升性能越来越困难，先进封装就变得关键。Chiplet、2.5D封装、3D封装，可以把计算芯片、存储芯片和其他模块更高效地连接在一起，提高系统性能。

第四是半导体设备和材料。

芯片不是凭空制造出来的。先进制程需要光刻、刻蚀、薄膜沉积、离子注入、清洗、检测等设备，也需要硅片、光刻胶、电子特气、靶材、封装材料等上游支撑。

Gartner在2026年4月的预测中则认为，全球半导体收入将在2026年超过1.3万亿美元，AI处理、数据中心网络、电源和存储需求是重要推动因素。

笔者昨天说了投资a股的6个利好，那么投资半导体，也有三个长期变量。

第一，投算力需求的增长。

模型越来越大，推理调用越来越多，AI应用越来越普及，算力需求会持续增长。未来还会向物理ai包括但不限于机器人演进

第二，投数据搬运效率的提升。

未来计算瓶颈不只在计算单元本身，也在存储、带宽、互连和封装。谁能让数据更快、更低功耗地流动，谁就拥有关键价值。

第三，投国产化和产业链安全。

半导体是现代科技产业的基础，也是全球科技竞争的核心领域。无论从AI、汽车、通信、工业控制，还是从供应链安全角度看，半导体都具有长期战略价值。

最后有一点想强调一下，AI到底是不是一种拟合，是不是一种准确度很高的猜测，可能没有那么重要。因为，人的行为究竟可不可以被预测呢？笔者认为，一定程度上，每个人的下一秒的状态同样可以被预测，累了想睡觉，开心了想说话，口渴了就喝水，本质上人也是一种被编程的生物，只是这种编程看起来的输出非常多样，误以为他具有很高的灵性。

有时候人和人的差异在哪？其实可能在神经元的数量和参数上

仔细思考，这其实是一个很有深度的问题。

← 上一篇：赛豆科技推出AI汽车品牌AIVA 年内发布首款量产车型下一篇：安徽省AI for Science中试基地拉开建设序幕 →