AI大模型里常说的标量、向量、张量:到底是什么?
这几个说法其实都是数学里的概念,早在一百多年前就已经存在,并不是计算机或AI才“发明”出来的。只是因为图像处理、AI大模型逐渐火起来,相关内容才更容易被大家听到、看到。
***
先把数字概念的演进脉络梳理一遍:
最初,人们为了更直观地统计周围事物的数量,就提出了自然数(0、1、2、3…);
随后,为了描述比 0 更小的情况,比如亏欠、低于零、相反方向等,引入了负数,于是就形成了整数体系;
再往后,为了表达“半个”“几分之几”“均分后的比例”这类并不总是完整整数的相对数量关系,有理数就被进一步用起来了;
同理,标量、向量、张量这些命名,正是为了更准确地刻画现实世界中不同“形态”的数据对象,慢慢发展成今天的样子。
***
一个人的年龄是30
今天的气温是30度
模型的学习率参数为1e−6
大模型推理参数top_k=30
这些数字彼此没有固定结构,也谈不上顺序或维度,更像是数据里最基础、最小的组成单位。
2.向量(Vector)——是一组按顺序排列的数字,本质上就是一个有序数组。
可以理解为:把若干个标量按同样的次序“排成一排”,例如:
再比如:
一批图片(批量大小×宽×高×通道)就对应4维张量;
视频数据(批量×帧数×宽×高×通道)则对应5维张量。
这样是不是清楚不少了。
补充说明下:
在计算机 / AI / 编程的日常交流里:大家通常说「维」
在数学 / 物理里用更严谨的说法:通常称为「阶」
***
***
其实在传统开发里,标量你每天都在用——比如数据库中各种基础类型的数据。
只要涉及语义匹配、一致性计算这类任务,向量就几乎是必需的。
如果你在做图片处理、滤镜、人脸识别、视频剪辑,底层数据结构往往就是张量;而在AI大模型/深度学习、自动驾驶等场景里,常见的还会是更高阶的张量。
简单总结:
END
欢迎关注、点赞、在看,给一点点鼓励就更好了