大模型为何爆发:跨过规模阈值的必然
今天的“大模型革命”,常被形容成一段“误打误撞的奇迹”。但曹古拉斯认为,真实情况更像是:人类点燃了火焰,可火势的扩展速度与范围,远远超出了最初的预想与掌控。AI看起来像个黑箱,我们却很难直接给出答案——到底是什么原因让AI走到今天的爆发。基于此,本文想围绕一个主题把脉:当面对人类亲手造出的黑箱时,AI的每一次高涨究竟是怎样被一步步推出来的。一、Transformer 的诞生:结构改变世界2017 年,一篇后来被频繁引用的论文—— Attention Is All You Need——提出了新的模型范式:T