标签

AI大模型里常说的标量、向量、张量:到底是什么?

发布时间:2026-05-02 12:02来源:微信阅读:5

这几个说法其实都是数学里的概念,早在一百多年前就已经存在,并不是计算机或AI才“发明”出来的。只是因为图像处理、AI大模型逐渐火起来,相关内容才更容易被大家听到、看到。

***

先把数字概念的演进脉络梳理一遍:

最初,人们为了更直观地统计周围事物的数量,就提出了自然数(0、1、2、3…);

随后,为了描述比 0 更小的情况,比如亏欠、低于零、相反方向等,引入了负数,于是就形成了整数体系;

再往后,为了表达“半个”“几分之几”“均分后的比例”这类并不总是完整整数的相对数量关系,有理数就被进一步用起来了;

同理,标量、向量、张量这些命名,正是为了更准确地刻画现实世界中不同“形态”的数据对象,慢慢发展成今天的样子。

***

一个人的年龄是30

今天的气温是30度

模型的学习率参数为1e−6

大模型推理参数top_k=30

这些数字彼此没有固定结构,也谈不上顺序或维度,更像是数据里最基础、最小的组成单位。

2.向量(Vector)——是一组按顺序排列的数字,本质上就是一个有序数组。

可以理解为:把若干个标量按同样的次序“排成一排”,例如:

再比如:

一批图片(批量大小×宽×高×通道)就对应4维张量;

视频数据(批量×帧数×宽×高×通道)则对应5维张量。

这样是不是清楚不少了。

补充说明下:

在计算机 / AI / 编程的日常交流里:大家通常说「维」

在数学 / 物理里用更严谨的说法:通常称为「阶」

***

***

其实在传统开发里,标量你每天都在用——比如数据库中各种基础类型的数据。

只要涉及语义匹配、一致性计算这类任务,向量就几乎是必需的。

如果你在做图片处理、滤镜、人脸识别、视频剪辑,底层数据结构往往就是张量;而在AI大模型/深度学习、自动驾驶等场景里,常见的还会是更高阶的张量。

简单总结:

END

欢迎关注、点赞、在看,给一点点鼓励就更好了