图灵奖得主辛顿探讨超级智能共存之道
讲台上的麦克风将轻微的咳嗽声放大成回声。在加拿大女王大学麦克唐纳粒子天体物理研究所的报告厅里,物理学家、计算机专业学生和一些带着笔记本的公众聚集在一起,构成了一幅略显特别的场景。杰弗里·辛顿站在灯光下,语速平缓,时而停顿,仿佛在等待听众跟上他的比喻。
他将当晚的主题定为“我们如何与超级智能共存”。但他并未以宏大的伦理宣言开场,而是先承认了一个不那么体面的事实:人类正以一种极其低效的方式传递信息——他在台上讲话,听众在台下点头或皱眉,数百个大脑依靠一句接一句的语言交换观点。随后他转身将这份“低效”作为引子,开始推演:如果一种智能不必如此低效,如果它能复制自身、并行学习、以远高于语言的带宽传递知识,那么“共存”就不再是一句愿望,而是一道迫在眉睫的工程难题。
在这道题上,他与强化学习领域的另一位重量级研究者理查德·萨顿的直觉几乎相反。萨顿更警惕“监管”成为控制的借口;辛顿则仍相信监管至少在一段时间内能发挥作用——并非因为它完美,而是因为人类目前尚未找到更可靠的刹车。差异不仅是政治立场的分歧,更指向更深层的分岔:当技术的增长速度开始超越社会协商的速度,人类还能用什么来组织风险?
辛顿的讲述如同一条逐级下沉的阶梯:先将听众带到语言模型的底层,再引导他们思考数字智能相对于人脑的结构性优势,最后将这种优势投射到未来的动机、冲突与控制问题上。每一步都不依赖耸动之言,而是依靠一个几乎令人不安的常识——聪明的系统会学会将自己留在谈判桌上。
两条路线:一场始于上世纪的分流
为了理解今天的大模型,辛顿先将时间拨回到上世纪五十年代。那时人工智能的愿景并不统一,更像是两条相互轻视的道路。
这也是他希望外行听众首先接受的一点:在这种框架下,所谓的“理解”不再是翻译成某种内部的无歧义语言,而是一种动态的兼容性匹配。
熟悉Transformer的人会立刻联想到query与key。辛顿自己也承认这不是严格的一一对应映射,但它为外行提供了一种直觉:意义并非写在某个中心符号表里,而是通过彼此的关系在结构中“成形”。
一句话学会新词:对乔姆斯基的挑战
讲到这里,辛顿做了一个微妙的转折:他并未将胜利归结为“神经网络战胜了符号主义”,而是将其视为下一层推演的基础——既然语言理解可以通过这种可复制的权重结构实现,那么数字智能在结构上就拥有人脑所不具备的某些优势。
这些优势,决定了“共存”之所以变得困难。
数字智能的三种优势:复制、带宽与并行
但他并未将这点讲述成一个“人类注定失败”的故事,因为“有死”也换来了同样重要的东西:能量效率。人脑是一台低功耗的模拟并行机器,拥有万亿级别的连接同时运作。一个神经元接收输入,本质上是电压与电导的物理过程——这几乎是自然界直接完成的乘法运算,而数字芯片通常需要大量位操作才能逼近同一结果。辛顿在台上用自嘲缓和这段物理解释:他对物理学了解不多,但至少知道电压乘以电导等于电荷。
这是一场交换:人脑的效率源于不可复制,数字智能的可复制性则伴随着更高的能耗。但在技术史上,能耗并非总是致命的约束——尤其当资本与基础设施愿意为性能买单时。
第二个优势更令人刺痛:知识如何传递。
当小模型通过蒸馏学习到这种分布时,它获得的不仅是答案,更是一种被压缩过的世界观。辛顿提到,现实中许多“小模型变聪明”的路径,都依赖于这样的知识传递。
在人类世界里,一位老师很难将自己对世界的“概率分布”直接灌输到另一位老师的脑中;他通常只能说出结论,再解释理由。蒸馏则像是一条更宽阔的管道。
一千个克隆体并行学习,再共享
第三个优势源于“复制”与“带宽”的结合:并行。
辛顿并不依赖科幻故事来描述威胁。他更像是在描述一种从目标函数中生长出的副产物——许多研究者称之为“工具性趋同”:不同的最终目标会在中间步骤上趋同于一些相似的动机,例如获取资源、避免被关闭、扩大影响力。
他甚至用动物行为学的差异来加深这个比喻:狮子是群居动物,或许还有“共处”的空间;老虎则不然。它不需要同伴,只需要空间与力量。
他说这不是一个令人满意的方案,只是他目前能想到、值得押注的方向。它像是一根在悬崖边临时锻造的绳索:你知道它不完美,但你也知道自己需要抓住些什么。
而要让这根绳索成形,仅靠某一家公司或某一个国家的善意是不够的。辛顿将话题推向另一层现实:国际合作。
这段讨论如同额外的一块石头压在讲座末尾:如果超级智能不仅更强大,而且可能以某种方式“体验”世界,那么共存的问题就不再仅仅是控制与安全,也关乎关系与伦理——我们究竟在与什么共处?
讲座结束时,辛顿没有用口号收尾。他将那只虎崽留在听众的脑海里:它仍然可爱、仍然有用、仍在迅速长大。人群起身、合上电脑、将问题塞回各自的生活:有人要回实验室,有人要回宿舍,有人要赶末班车。讲台的灯光暗下去,剩下的只是一个不太体面的现实——人类仍在用低带宽的语言彼此告诫,而另一种更高带宽的智能,正以复制、蒸馏与并行的方式加速成长。
共存听起来像一种道德姿态,但在辛顿的推演中,它更像是工程学中最难的一类约束:你无法关闭系统,又必须确保它不会将你视为可以绕过的障碍。于是问题变成了那道近乎冷酷的选择题——在虎崽还愿意学会“在乎你”的时候,你能否及时教会它这一点,并且让全世界都愿意一起教。
阅读最新前沿科技趋势报告,请访问21世纪关键技术研究院的“未来知识库”
截止到2月28日 ”未来知识库”精选的百部前沿科技趋势报告
(加入未来知识库,全部资料免费阅读和下载)
上下滑动查看更多