标签

AI 历程:谁绘制了主宰发展的"神性曲线"?

发布时间:2026-05-17 19:38来源:微信阅读:5

如今,众人皆晓“模型越大智能越强”,当行业巨头拼命堆叠参数、倾尽算力训练大模型时,鲜少有人忆起,这一发展路径的源头,竟始于 OpenAI 早年一次意外且精妙的数学洞察。

而这一发现的领军人,正是日后创立 Anthropic 的达里奥·阿莫代伊。

达里奥·阿莫代伊的经历颇为传奇:他曾在百度研究团队实习,2016 年加入 OpenAI,自起步便深耕人工智能安全领域——致力于让 AI 系统更贴合人类偏好与价值观,规避对人类的伤害。

正是在此方向的探索中,他率领团队研发出后来重塑行业格局的技术:人类反馈强化学习(RLHF)。此项技术至今仍是实现大模型与人类价值观对齐的核心手段。

然而阿莫代伊并未就此止步。他坚信,该方法不应局限于小模型测试,而应拓展至更强大的模型。恰逢 GPT 问世,为他提供了绝佳契机。

彼时,GPT-1 初出茅庐,但体量尚小。阿莫代伊与拉德福德携手,目标明确:将 GPT-1 规模扩大十倍以上,打造一款拥有 15 亿参数的语言模型。以今日视角看,15 亿参数或许微不足道,但在当时,这已是业界顶尖模型之一。

随着模型规模逐级攀升,一件令所有研究者瞩目的现象出现了:

模型性能的提升竟遵循着一种极为优美的数学规律。

训练数据量、算力投入度、模型参数规模,这些变量与模型性能间的关联,竟能被一条平滑曲线完美刻画。无论模型放大至何种尺寸,性能几乎都平稳地落在这条曲线上。

这便是日后深刻影响整个 AI 界——Scaling Law(缩放定律)。

这一发现的意义何在?

它证实了,单纯扩大规模本身,便可能成为驱动 AI 进步的核心动力。只要持续堆叠参数、增加数据、投入更多算力,模型能力便会依循稳定的幂律关系提升,智能亦将由此自发涌现。

这一结论在当时堪称石破天惊。此前,许多人认为 AI 进步需不断发明新算法、新架构,但 Scaling Law 揭示:其实无需如此复杂,“大力出奇迹”确有其效。

此定律在此后数年间,成为深刻影响整个 AI 行业的最重要信条之一,甚至可称为一种“思想钢印”:

通往 AGI 的天梯真实存在,且路径极简——那便是不断 Scale(放大)。

当最大的模型训练完成,它被命名为 GPT-2。

相较于 GPT-1,GPT-2 的表现堪称飞跃:它能处理各类语言任务,生成更长更连贯的文章,有时甚至令读者难辨是机器还是人类所写。虽如今看 GPT-2 生成的文字仍存错误、断裂及逻辑混乱,但那是人类史上首次,大规模自动写作真正成为可能。

但阿莫代伊并不满足于此。Scaling Law 的发现让他笃信,若此定律正确,便应走得更远。他开始着手训练 GPT-3,此次目标非扩大数倍,而是直接扩大百倍。

后续的故事,世人皆知。

今日,当我们谈论 GPT-4o、谈论千亿参数模型、谈论 AGI 时,实则仍行走在阿莫代伊当年发现的那条道路上。Scaling Law 依旧指引行业方向,更大的模型正不断涌现更强能力。

有趣的是,当年那位痴迷 AI 安全的研究者,后因对 OpenAI 发展方向的分歧而离开,创办了 Anthropic,推出了 Claude,仍在践行其初心——让安全、可控、有益的 AI 更好地服务人类。

历史有时如此有趣:一个源自安全研究的副产品,意外重塑了整个 AI 行业的发展轨迹。那条优美的数学曲线,至今仍在推动人类向智能的未知疆域不断迈进。

本文整理自 AI 行业发展历史公开资料