AI 历程：谁绘制了主宰发展的"神性曲线"？

发布时间：2026-05-17 19:38阅读：13

如今，众人皆晓“模型越大智能越强”，当行业巨头拼命堆叠参数、倾尽算力训练大模型时，鲜少有人忆起，这一发展路径的源头，竟始于 OpenAI 早年一次意外且精妙的数学洞察。

而这一发现的领军人，正是日后创立 Anthropic 的达里奥·阿莫代伊。

达里奥·阿莫代伊的经历颇为传奇：他曾在百度研究团队实习，2016 年加入 OpenAI，自起步便深耕人工智能安全领域——致力于让 AI 系统更贴合人类偏好与价值观，规避对人类的伤害。

正是在此方向的探索中，他率领团队研发出后来重塑行业格局的技术：人类反馈强化学习（RLHF）。此项技术至今仍是实现大模型与人类价值观对齐的核心手段。

然而阿莫代伊并未就此止步。他坚信，该方法不应局限于小模型测试，而应拓展至更强大的模型。恰逢 GPT 问世，为他提供了绝佳契机。

彼时，GPT-1 初出茅庐，但体量尚小。阿莫代伊与拉德福德携手，目标明确：将 GPT-1 规模扩大十倍以上，打造一款拥有 15 亿参数的语言模型。以今日视角看，15 亿参数或许微不足道，但在当时，这已是业界顶尖模型之一。

随着模型规模逐级攀升，一件令所有研究者瞩目的现象出现了：

模型性能的提升竟遵循着一种极为优美的数学规律。

训练数据量、算力投入度、模型参数规模，这些变量与模型性能间的关联，竟能被一条平滑曲线完美刻画。无论模型放大至何种尺寸，性能几乎都平稳地落在这条曲线上。

这便是日后深刻影响整个 AI 界——Scaling Law（缩放定律）。

这一发现的意义何在？

它证实了，单纯扩大规模本身，便可能成为驱动 AI 进步的核心动力。只要持续堆叠参数、增加数据、投入更多算力，模型能力便会依循稳定的幂律关系提升，智能亦将由此自发涌现。

这一结论在当时堪称石破天惊。此前，许多人认为 AI 进步需不断发明新算法、新架构，但 Scaling Law 揭示：其实无需如此复杂，“大力出奇迹”确有其效。

此定律在此后数年间，成为深刻影响整个 AI 行业的最重要信条之一，甚至可称为一种“思想钢印”：

通往 AGI 的天梯真实存在，且路径极简——那便是不断 Scale（放大）。

当最大的模型训练完成，它被命名为 GPT-2。

相较于 GPT-1，GPT-2 的表现堪称飞跃：它能处理各类语言任务，生成更长更连贯的文章，有时甚至令读者难辨是机器还是人类所写。虽如今看 GPT-2 生成的文字仍存错误、断裂及逻辑混乱，但那是人类史上首次，大规模自动写作真正成为可能。

但阿莫代伊并不满足于此。Scaling Law 的发现让他笃信，若此定律正确，便应走得更远。他开始着手训练 GPT-3，此次目标非扩大数倍，而是直接扩大百倍。

后续的故事，世人皆知。

今日，当我们谈论 GPT-4o、谈论千亿参数模型、谈论 AGI 时，实则仍行走在阿莫代伊当年发现的那条道路上。Scaling Law 依旧指引行业方向，更大的模型正不断涌现更强能力。

有趣的是，当年那位痴迷 AI 安全的研究者，后因对 OpenAI 发展方向的分歧而离开，创办了 Anthropic，推出了 Claude，仍在践行其初心——让安全、可控、有益的 AI 更好地服务人类。

历史有时如此有趣：一个源自安全研究的副产品，意外重塑了整个 AI 行业的发展轨迹。那条优美的数学曲线，至今仍在推动人类向智能的未知疆域不断迈进。

本文整理自 AI 行业发展历史公开资料