AI大模型里常说的标量、向量、张量：到底是什么？

发布时间：2026-05-02 12:02阅读：16

这几个说法其实都是数学里的概念，早在一百多年前就已经存在，并不是计算机或AI才“发明”出来的。只是因为图像处理、AI大模型逐渐火起来，相关内容才更容易被大家听到、看到。

***

先把数字概念的演进脉络梳理一遍：

最初，人们为了更直观地统计周围事物的数量，就提出了自然数（0、1、2、3…）；

随后，为了描述比 0 更小的情况，比如亏欠、低于零、相反方向等，引入了负数，于是就形成了整数体系；

再往后，为了表达“半个”“几分之几”“均分后的比例”这类并不总是完整整数的相对数量关系，有理数就被进一步用起来了；

同理，标量、向量、张量这些命名，正是为了更准确地刻画现实世界中不同“形态”的数据对象，慢慢发展成今天的样子。

***

一个人的年龄是30

今天的气温是30度

模型的学习率参数为1e−6

大模型推理参数top_k=30

这些数字彼此没有固定结构，也谈不上顺序或维度，更像是数据里最基础、最小的组成单位。

2.向量（Vector）——是一组按顺序排列的数字，本质上就是一个有序数组。

可以理解为：把若干个标量按同样的次序“排成一排”，例如：

再比如：

一批图片（批量大小×宽×高×通道）就对应4维张量；

视频数据（批量×帧数×宽×高×通道）则对应5维张量。

这样是不是清楚不少了。

补充说明下：

在计算机 / AI / 编程的日常交流里：大家通常说「维」

在数学 / 物理里用更严谨的说法：通常称为「阶」

***

其实在传统开发里，标量你每天都在用——比如数据库中各种基础类型的数据。

只要涉及语义匹配、一致性计算这类任务，向量就几乎是必需的。

如果你在做图片处理、滤镜、人脸识别、视频剪辑，底层数据结构往往就是张量；而在AI大模型/深度学习、自动驾驶等场景里，常见的还会是更高阶的张量。

简单总结：

END

欢迎关注、点赞、在看，给一点点鼓励就更好了