标签

Demis Hassabis:从棋局到诺奖的 AI 先行者

发布时间:2026-04-27 07:30来源:微信阅读:6

在 AI 圈里,很多人登场的方式是退学创业、写长文、或是在某次产品突然爆红后一下子被推到聚光灯下。Demis Hassabis 不同。他更像一位古典学者:国际象棋大师、游戏设计师、认知神经科学博士,然后在 38 岁把公司卖给 Google,48 岁又拿下诺贝尔化学奖。

这条路并不像硅谷惯常的叙事,更像某位维多利亚时代博物学家的传记。但也正是这个人,做出了 AlphaGo、AlphaFold 和 Gemini——三个分别攻克棋类博弈、蛋白质折叠与大语言模型的 AI 系统。

1976 年 7 月 27 日,Demis Hassabis 出生在伦敦北部。父亲是希腊裔塞浦路斯人,母亲是新加坡华人。这样的跨文化家庭背景,他后来经常提到——或许也正因为如此,他从小就学会了在不同世界之间自如切换。

四岁时他就开始下国际象棋。那个年纪,许多孩子还在认字母。到了 13 岁,他已经拿到国际象棋大师(chess master)的称号,在同龄人中排名世界第二。

不过,棋只是他众多兴趣里的一个。他对计算机和游戏同样着迷。按他自己的说法,小时候会攒零花钱买编程书,再照着书上的例子在早期家用电脑上敲代码。他写出的第一个完整程序,是一个黑白棋(Othello)游戏——那时他大概才十一二岁。

在 Hassabis 的人生里,游戏占据了非常特殊的位置。它不仅是娱乐,更是他研究智能的实验场。

15 岁那年,他在一家叫 Bullfrog Productions 的游戏公司兼职写代码。这家公司在 90 年代的英国游戏圈非常有名,创始人是 Peter Molyneux(后来做了《神鬼寓言》)。Hassabis 的能力很快就被注意到——到 17 岁时,他已经成了游戏《Theme Park》(主题公园)的首席开发者。

《Theme Park》是一款模拟经营游戏,玩家要建造并管理一座主题公园。1994 年推出后卖出了数百万份,并被移植到当时几乎所有主流平台。游戏里的游客行为由 AI 驱动,他们会依据心情、饥饿程度和钱包余额做出不同选择——这种“用 AI 模拟复杂行为”的思路,其实和后来 DeepMind 的很多工作是一脉相承的。

Hassabis 在伦敦的 Christ's College Finchley 完成中学阶段学习,16 岁就考完了所有考试,比正常进度提前了两年。随后他进入剑桥大学学习计算机科学。

1997 年,他从剑桥毕业。接下来的十年,他走了一条在旁人看来有些曲折的路。

他先去了 Lionhead Studios——又是 Peter Molyneux 的公司——担任首席 AI 程序员,参与了《Black & White》的开发。这款游戏里,玩家扮演神灵,通过手势和行动影响信徒,游戏中的生物会根据玩家的行为“学习”和“成长”。这大概是 Hassabis 第一次把强化学习的思路落到商业产品中,虽然当时他未必使用了这个术语。

1998 年,22 岁的他离开 Lionhead,自己创办了 Elixir Studios。公司推出了两款游戏:《Republic: The Revolution》(2003)和《Evil Genius》(2004)。前者是关于政治革命的模拟策略游戏,后者则让玩家扮演卡通反派,建设秘密基地。两款作品都拿到了不少奖项,尤其是《Evil Genius》,后来成了邪典经典。

不过 Hassabis 显然并不满足于只做游戏。2005 年,他卖掉了 Elixir 的资产,做出一个让很多人意外的决定:去读博。

他进入伦敦大学学院(UCL),攻读认知神经科学 PhD。

放在当时看,这个选择确实有些突然——一个已经成功的游戏开发者,为什么要跑去研究海马体?但如果理解 Hassabis 真正的驱动力,这一切就完全说得通。

他后来多次表示,自己做游戏的终极目标从来不是娱乐,而是理解智能。游戏是被简化后的现实世界,优秀的游戏 AI 需要规划、记忆、决策——这些正是智能的核心能力。但他发现,单靠工程手段已经碰到天花板,必须从“源头”寻找灵感。

这个“源头”就是人脑。他在 UCL 的研究聚焦于记忆和想象力——大脑如何把过往经验重新组合,从而构建出尚未发生的场景。他的研究发在《Nature》《Science》等顶级期刊上,还被《Guardian》评为当年的“Science Blog of the Year”。

2009 年博士毕业后,他又在哈佛和 MIT 做博士后,同时拿到了 UCL 的 Henry Wellcome 奖学金。到这时,他的履历已经横跨计算机科学、游戏 AI 和认知神经科学三个领域。

也正是这种跨学科背景,让他后来在 DeepMind 的方向上,和其他 AI 创业者有了完全不同的视角。

2011 年,Hassabis 和 Shane Legg(新西兰计算机科学家,也是 UCL 的博士)以及 Mustafa Suleyman(英国企业家、Hassabis 的发小)一起在伦敦创立了 DeepMind。

要注意这个时间点。2011 年,深度学习还远没到爆红的时候——AlexNet 点燃 CNN 还要等到 2012 年。那时去做 AI 创业,在硅谷投资人眼里几乎和造太空电梯一样离谱。但 Hassabis 不是在跟风,他非常清楚自己想做什么:以深度强化学习(deep reinforcement learning)为切口,向通用人工智能(AGI)推进。

他把深度学习和强化学习结合起来——前者负责从数据里提取模式,后者负责通过试错学习策略。这个方向在当时并不是主流,但 Hassabis 的神经科学背景让他相信:多巴胺系统本来就类似强化学习,大脑天然就是这样工作的。

DeepMind 早期最出圈的成果,是让 AI 去玩 Atari 游戏。

2013 年,他们发表了 DQN(Deep Q-Network)论文。这个程序不需要人手把手教规则——它只看屏幕像素,再被告知“分数越高越好”。靠着自己摸索,它学会了 49 款经典 Atari 游戏的玩法,并在很多游戏里达到了人类甚至超人类水平。

这件事在 AI 圈引发了极大震动。但它真正的价值不只是“AI 会打游戏”,而是证明了深度强化学习可以端到端地从原始输入中学到复杂策略。这是一个通用方法的雏形。

然后,轮到了围棋。

围棋长期被视为 AI 的“圣杯”之一——因为可能的棋盘状态数量比宇宙中的原子还多,传统暴力搜索根本行不通。2016 年 3 月,AlphaGo 在首尔以 4:1 击败世界冠军李世石。全球超过 2 亿人观看了这场比赛。

李世石在第四局下出了一步被称作“神之一手”的妙招,拿下了 AlphaGo 唯一输掉的一局。但这反而更能说明 AlphaGo 的强大——在另外三局里,它几乎没有给人类冠军任何机会。

后面的故事大家就比较熟悉了:AlphaGo Zero 从零开始训练(只知道规则,不看任何人类棋谱),以 100:0 击败 AlphaGo。AlphaZero 用同样方法又攻下了国际象棋和日本将棋。MuZero 更进一步——连规则都不需要提前告诉它,它会自己摸索规则并学会精通游戏。

但很多人忽略了一点:Hassabis 从来都不只是想做一个下棋 AI。游戏只是他的试验场。

蛋白质折叠问题在生物学中的地位,大致相当于黎曼猜想之于数学——大家都知道它极其重要,但几十年来进展一直很慢。

简单来说:蛋白质由氨基酸链折叠成三维结构,而结构决定功能。如果知道一条氨基酸序列,理论上就能推算出它的三维形态。可现实里,即便是一个只有 100 个氨基酸的小蛋白质,可能的三维构型也有 10 的 47 次方种——比宇宙中的原子总数还多。这就是所谓的“蛋白质折叠问题”。

从 1994 年开始,学术界每两年举办一次 CASP 竞赛(Critical Assessment of protein Structure Prediction),专门测试各种蛋白质结构预测方法。到 2010 年代中期,最优秀的方法准确率大约只有 40%。

2018 年,DeepMind 带着 AlphaFold 参加 CASP13,准确率直接提升到约 60%。这个成绩已经让生物学界震惊——相当于一夜之间跨过了十几年的研究进度。但 Hassabis 仍然不满足。

真正的转折点,是 John Jumper 的加入。Jumper 是一位有蛋白质模拟背景的物理学家,他与 Hassabis 团队合作重构了整体架构,最终推出 AlphaFold2。到了 2020 年的 CASP14,AlphaFold2 的准确率达到了约 90%——几乎和实验方法(X 射线晶体学)的结果不相上下。

蛋白质折叠问题,被一个 AI 团队攻克了。

2021 年,他们又用 AlphaFold2 预测了人类全部 5 万多种蛋白质的结构。随后更进一步,把已知约 2 亿种蛋白质的结构也预测了出来,覆盖大约 100 万个物种。Hassabis 把这称作“整个蛋白质宇宙”。

2024 年 10 月,诺贝尔化学奖颁给了 Demis Hassabis 和 John Jumper(各占四分之一),另一半授予 David Baker。授奖理由正是“蛋白质结构预测”。

一位计算机科学家拿下诺贝尔化学奖,这在诺奖历史上极为罕见。但细想其实完全合理——AlphaFold2 不只是工程突破,它已经改变了整个生物学的研究方式。

再回到 2014 年。那一年,Google 以约 4 亿英镑(当时约 6.5 亿美元)收购了 DeepMind。Hassabis 继续留任 CEO,公司也保持在伦敦独立运营。

这笔收购当时争议不小。很多人认为 Google 为这个只有几十人的小团队花得太多。但现在回头看,这很可能是 Google 近十年最划算的一次投资。

DeepMind 给 Google 带来了什么?WaveNet(Google Assistant 的语音合成技术)、数据中心冷却优化(省下大量电费)、YouTube 视频压缩、Android 电池管理……这些看上去彼此无关的技术,底层其实都在使用 DeepMind 的 AI 能力。

但更大的变化发生在 2023 年。

2023 年 4 月,Google 做出一次重要组织调整:将 Google Brain(Google 内部的 AI 研究团队)与 DeepMind 合并,成立 Google DeepMind,由 Hassabis 出任 CEO。

Google Brain 可不是“小角色”。Transformer 架构就是他们在 2017 年提出的——没错,就是现在几乎所有大语言模型(包括 GPT、Claude、Gemini)的底层架构。BERT、PaLM、LaMDA 也都出自这个团队。

两股顶级 AI 研究力量汇合后,Hassabis 成了整个 Google AI 的掌舵人。

2023 年 12 月,Gemini 1.0 正式发布。这是合并后的 Google DeepMind 交出的第一份答卷。

和 OpenAI 的 GPT 系列不同,Gemini 从一开始就是原生多模态设计——不是把文本、图像、音频分别处理后再拼接,而是在训练阶段就同时处理所有模态。Hassabis 发布时写过一篇长文,核心观点是:AI 不该只是“一个聪明的软件”,而应当像“一个有用的专家助手”。

到 2026 年 4 月,Gemini 已经迭代到 3.1 版本。从公开 benchmark 看,Gemini 3.1 Pro 在 MMLU-Pro(91.0%)和 GPQA Diamond(94.3%)上都拿到了所有模型中的最高分。在 DeepSeek V4 的对照数据里,它的 GPQA Diamond 成绩也超过了 GPT-5.4、Claude Opus 4.6 和 DeepSeek V4-Pro 本身。

不过在 agentic 能力上,Gemini 仍然存在短板——Terminal-Bench 2.0 只有 68.5%,而 GPT-5.5 达到 82.7%。这说明一个有趣的格局:Google/DeepMind 在“知识”和“推理”维度很强,但在“帮你在电脑上干活”这件事上,暂时还落后于 OpenAI。

和 Sam Altman 那种“快速迭代、产品先行”的风格不同,也不同于 Anthropic 那种“安全优先、谨慎发布”的路线,Hassabis 的风格可以概括为:科学驱动,长期主义,从游戏走向现实。

他几乎不在社交媒体上制造声量,不做播客常客,也很少公开与竞争对手互怼。他更像一位住在伦敦的研究型 CEO——每周还会亲自跟进具体项目的进展。

几个细节,足以看出他的风格:

• AlphaGo 击败李世石之后,他没有急着商业化,而是转身去做了 AlphaFold。从“让 AI 玩游戏”到“让 AI 解决科学问题”,这一转向本身就是态度。

• DeepMind 是最早设立独立 AI 伦理委员会的公司之一,甚至在被 Google 收购之前就已经设有。这件事当时在技术圈有争议,但从今天回看,确实相当前瞻。

• 他在诺奖颁奖典礼上的发言里特别提到,AlphaFold 的预测结果已经免费开放给全球研究者。至少在科学应用上,商业化从来不是他的第一优先级。

Hassabis 拿过的奖项和荣誉多到需要单独列一段:

他多次入选《时代》杂志全球 100 位最具影响力人物,是英国皇家学会院士、英国皇家工程院院士。2024 年又因诺贝尔奖被授予爵士头衔。

如果梳理他在各种场合表达过的观点,会发现有几条信念始终贯穿其中:

第一,AI 应该用来解决科学问题。这是他和其他 AI 公司 CEO 最大的不同。Altman 想用 AI 改变工作方式,Hassabis 想用 AI 改变科学发现的方式。AlphaFold 不是产品,而是科学工具。Gemini 虽然是商业产品,但 DeepMind 的研究重心始终没有离开科学应用——核聚变等离子体控制、天气预报、新材料发现,都是它在推进的方向。

第二,通用智能需要跨学科。从游戏到神经科学再到 AI,Hassabis 一直相信,真正的智能不可能只靠单一学科突破。DeepMind 从成立第一天起,就有意识地招募神经科学家、数学家、物理学家,而不只是计算机工程师。

第三,安全与发展并不冲突。他既不是“先做了再说”派,也不是“先停下来谈安全”派。他的观点是,理解 AI 最好的方式就是去构建它,但在构建的同时也必须建立护栏。DeepMind 很多安全研究(比如 AI 系统可解释性)早在 2015-2018 年就已经开始,比行业主流早了不少。

2021 年,Hassabis 在 DeepMind 内部孵化了 Isomorphic Labs,目标是用 AI 重塑药物发现。AlphaFold 解决的是“蛋白质长什么样”,而 Isomorphic Labs 要回答的是“如何设计药物与这些蛋白质相互作用”。

到了 2026 年,DeepMind / Google DeepMind 的版图已经非常清楚:

•Gemini 系列:面向消费者和开发者的通用 AI 模型

•AlphaFold 系列:蛋白质结构预测,已经进入 AlphaFold 3 代

•Isomorphic Labs:AI 驱动的药物发现

•AlphaDev / AlphaProof 等:用 AI 发现新算法和数学证明

Hassabis 多次公开表示,他相信 AGI 可能会在“未来十年内”实现。和很多同行的模糊说法不同,他给出了相对明确的时间线。当然,这种预测也容易被现实打脸(他 2016 年也说过类似的话),但至少说明他的目标从未动摇。

回顾 Hassabis 的人生轨迹,有一条线始终没有变:对“智能本质”的执着追问。

四岁下棋,是在研究策略智能。十七岁做游戏 AI,是在模拟行为智能。读博研究海马体,是在逆向工程人类的记忆与想象。创办 DeepMind,是试图用工程手段重现这些能力。做 AlphaFold,则是在证明这套方法能解决真实世界的科学问题。

每一步看似跳跃,其实都在同一条路上。

在一个充满辍学创业者和融资新闻的 AI 行业里,Hassabis 显得有些另类。他把书读完了——从剑桥到 UCL,再到哈佛和 MIT。他不追风口,也不靠流量。下棋、做游戏、研究大脑、训练 AI,这些事情对他来说,其实都是同一个终极目标的不同切面。

2024 年诺贝尔化学奖揭晓的那一刻,也许就是对这种长期主义最好的注脚。当全世界都在为 ChatGPT 的产品体验兴奋时,一个在伦敦安静用 AI 解决科学问题的人,拿走了科学界的最高荣誉。

Demis Hassabis 不像 Sam Altman 那样站在舆论风暴中心,也不像 Ilya Sutskever 那样自带理想主义光环。他更安静,也更学术。但他造出来的东西——AlphaGo、AlphaFold、Gemini——每一个都实实在在地改变了各自领域。

某种程度上,他是这个时代最接近达芬奇的人:棋手、程序员、神经科学家、企业家、诺奖得主。而且,他今年才 49 岁。