谷歌AI为何能反超OpenAI？

发布时间：2026-04-10 20:54阅读：18

先看其人，再看其事，哈萨比斯逐渐成为奥尔特曼的另一面。

到了2026年，OpenAI的市场份额持续走低，谷歌Gemini与Anthropic的Claude则不断上升。

近期，《哈萨比斯：谷歌AI核心大脑》一书面世，意味着中文读者终于拥有了理解这位谷歌AI关键人物的一手材料。作者马拉比长期与哈萨比斯进行每次两小时的深度交谈，最终将总计30小时的访谈与大量资料整理成这部传记。

这本书不仅描绘了哈萨比斯的精神气质和成长经历，也揭示了他如何带领DeepMind走出一条与OpenAI截然不同的道路：一方以科学研究为中心，沿着更克制、更谨慎的路线前进；另一方则体现出强调速度、崇尚破局的公司文化。

更关键的是，书中将哈萨比斯塑造成「企业家+科学家」的复合形象。这批早期AI探索者切入AI的起点，是科学研究，是对一种新认知形态的哲学追问；而OpenAI的奥尔特曼则代表另一类人，他们把AI视为可以借势而上的风口，因为它能带来影响力与财富。

理解事情之前，先理解人物。

哈萨比斯成长于伦敦的一个移民家庭，5岁时就是国际象棋天才少年，后来在剑桥攻读神经科学。创办DeepMind后，他先以AlphaGo击败人类围棋冠军，又用AlphaFold破解蛋白质折叠问题，并因此获得诺贝尔化学奖。他最终设想中的AI，是一种“无限机器”，能够无限归纳数据，进一步跃升为数学意义上的AGI。

回顾过去15年，谷歌始终是AI世界里最重要的力量之一。

如今全球AI产业中，约90%的关键突破都出自谷歌大脑、谷歌Research或DeepMind，例如AlphaGo、强化学习，以及Transformer架构。按照哈萨比斯过去的设想，AI本应沿着更稳健的研发路径前进，让更多类似AlphaFold的成果应用在癌症治疗、新能源和新材料等领域，真正惠及人类。

然而现实并未按设想展开，技术演进往往难以预料。OpenAI率先把大模型的对话与生成能力推向大众市场，谷歌则在一度落后的局面下迅速追赶，通过组织重整打造Gemini 3.0，最终将其在全球通用AI流量市场中的份额提升至21.5%，而ChatGPT则从86.7%降至64.5%。

而哈萨比斯，正是解读谷歌AI能力版图的关键人物之一。

《哈萨比斯：谷歌AI核心大脑》中，也公开了不少科技史背后的细节。

例如当年谷歌收购DeepMind时，Facebook的扎克伯格其实报出了更高价格，但哈萨比斯依旧选择谷歌。原因在于，他看重的是人，而不是出价。扎克伯格并没有展现出对AGI长期愿景的深刻理解，而谷歌联合创始人拉里·佩奇显然更懂这一点。

「他当时其实是在对我说，也许你完全可以打造一家像谷歌那样的公司，但那会耗掉你职业生涯里最宝贵的时光，」哈萨比斯回忆拉里·佩奇时说道，「可如果我真正的目标是构建通用人工智能，那为什么不直接使用他已经积累起来的全部资源？我觉得这个说法很有说服力。」

2014年1月底，谷歌以6.5亿美元完成对DeepMind的收购，以今天的眼光来看，这笔交易堪称超值。

但对哈萨比斯而言，真正重要的收获，是此后十年里谷歌向DeepMind持续投入了数十亿美元研究经费。自少年时代起他就怀有的超级智能理想，也因此迅速进入快车道。

后来哈萨比斯虽然进入谷歌核心管理层，却一直住在伦敦而非硅谷，因为在他看来，英国社会比硅谷更平衡，他也不愿彻底被硅谷那种逐利文化所同化。

哈萨比斯虽然与硅谷长期合作，也接受了它的资本支持，但始终保持某种距离。在和马拉比的交流中，他直言批评那些把利润、速度和市场主导地位放在第一位的企业掌舵者，认为这种取向过于「短视、逐利」。

事实上，DeepMind与谷歌之间也曾爆发治理和权力上的冲突。DeepMind内部一度不满谷歌在AI治理与安全监督上的控制方式，他们担心未来AGI的部署会完全被商业利益主导，而不是由安全与伦理原则决定，因此希望为DeepMind建立一套独立于谷歌商业董事会的治理结构。

但这个代号为「Project Mario」的秘密拆分计划最终未能实现，因为谷歌无法接受外部独立人士对其核心专有技术拥有否决权。DeepMind联合创始人苏莱曼也因此离开，后来转而担任微软AI负责人。

这是外界首次较完整地看到DeepMind与谷歌内部权力博弈的全貌。

这段经历也促使哈萨比斯发生转变。他开始由一个理想主义者走向现实主义者，因为他明白，在一家以盈利为目的的企业中，过于理想化的去信任化治理结构（trustless governance structures）根本无法落地，真正可行的道路，是在公司内部获取实际权力。

更重要的是，在这本传记中，哈萨比斯被塑造成奥尔特曼的反向样本：AI应服务于科学启蒙，而不是权力和财富。这也是理解哈萨比斯与奥尔特曼差异的一个重要入口。

奥尔特曼被描绘成一个更看重权力与财富的AI领导者，而哈萨比斯则是科学家+企业家的结合体。这不仅仅是公众形象上的不同，更是底层价值判断和发展逻辑上的根本区别。

奥尔特曼深知硅谷的竞争法则，产品必须抢先一步进入市场，这几乎是生存级要求。最能体现他权力欲的，或许是导师格雷厄姆那句评价：山姆极其擅长获得权力，你把他空投到一个食人族岛上，五年后再回来，他已经成了国王。

这也解释了为什么DeepMind在大语言模型上曾一度落后于OpenAI，因为哈萨比斯始终坚持「科学优先」的神经科学路线，对大语言模型一直保持怀疑态度。他做这件事首先是为了知识与科学，而不是市场。

在近期采访中，哈萨比斯也对行业格局和未来趋势给出不少判断。比如他认为开源模型永远会慢前沿一代，头部之间的竞争差距会继续扩大，未来整个行业需要建立一个国际性合作组织。

他判断，目前全球最顶尖的三到四家实验室，与其他所有机构之间的差距，正以两年前完全看不到的方式持续拉大。这背后的原因是结构性的，并不只是因为它们投入了更多资金。

「缩放定律、Transformer架构、人类反馈强化学习流程」，这些当下主流技术路径已经被广泛传播，也被大量复现。它们的边际收益正在减弱，那些仅仅擅长熟练运用既有技术的机构，正在逐步逼近增长上限。接下来决定胜负的，不是谁把已知技术执行得更高效，而是谁能创造出下一代算法。

同时，AI工具本身也在推动下一代系统的研发提速。代码助手让研究者更快迭代模型架构；数学推理工具帮助验证新模型的特征。前沿实验室不只是沿着同一赛道跑得更快，而是在重新定义赛道本身。

「要从同一套技术路线中继续挖出相同水平的收益，正变得越来越困难。所以我相信，未来几年里，能够提出全新算法思路的实验室，会获得更明显的领先优势——因为上一代思路的潜力已经几乎被彻底榨干。」

在开源议题上，哈萨比斯的态度是谨慎而清晰的：开源模型将始终比最前沿模型大约慢一代。

这并不是因为开源社区缺少天赋或投入，而是因为追赶本身需要时间。前沿实验室一旦发表新的突破，开源社区往往需要大约半年时间，才能完成复现、深入理解并高质量实现；而在这半年里，前沿实验室并不会原地等待。

这种差距不会真正消失，它只会不断向前移动。

DeepMind对此给出的方案，是推出自己的Gemma系列模型：一种轻量级开源模型，目标不是硬碰绝对前沿，而是在相同规模下做到最强。

因此，哈萨比斯对Gemma的目标用户有非常清晰的界定：包括缺乏大规模算力基础设施的早期开发者、算力有限的学术研究人员、不愿依赖API的创业团队，以及必须进行本地部署的边缘计算场景。他认为，对于这些使用情境来说，开源模型并非退而求其次，很多时候反而是更合适的方案。

关键在于，外界必须清楚它的定位和边界。

另一个更重要的问题是，当被问及当前AI行业有哪些方面低于当年预期时，哈萨比斯指出，持续学习（continual learning）仍然是明显短板。这些系统在训练完成、部署到真实环境之后，往往就停止继续学习了，模型在增量学习和持续吸收新知识方面依然很弱。

「因为整个行业还没有真正找到成熟可行的方法，所有头部实验室都在研究，如何把新知识整合进那些已经训练了数月的成熟系统之中。而人类大脑在这方面却做得非常自然，极有可能依赖睡眠、强化学习等机制。」

此外，当前AI的发展仍有许多障碍需要跨越，其中最大的一个问题也许是一致性（consistency）。「我有时把这些系统称作‘锯齿状智能’（jagged intelligence），因为它们在某种提问方式下表现惊艳，但只要问题表达稍有变化，就可能在很基础的地方犯错，真正的通用智能不应该存在这种缺陷。」

组织层面的变化往往先于产品层面的变化，而组织能力的重塑进一步推动了技术跃迁，这正是谷歌Gemini后来实现反超的重要原因。

去年11月中旬，谷歌发布Gemini 3.0模型，凭借其在推理和多模态能力上的强势表现，给ChatGPT带来了巨大压力。一个核心原因就在于更早之前，谷歌DeepMind与谷歌大脑这两个AI团队已经完成合并，哈萨比斯出任新部门负责人，而原谷歌大脑负责人杰夫·迪恩则担任新团队首席科学家。

团队的调整是一切变化的起点。哈萨比斯后来表示：「我们把公司分散在全球的人才整合起来，朝着同一个目标推进；同时，我们把所有算力资源集中起来，用于打造最大规模的模型，而不是在公司内部同时分散做两三个版本。

很大程度上，我们只是把原本已有的优势重新拧成一股绳，然后以创业公司般极致聚焦的节奏和强度全速推进，让我们重新回到前沿，并在多个方向取得领先。」

事实上，在当时外界并不完全看好哈萨比斯，因为谷歌大脑负责人杰夫·迪恩看起来拥有更强的产品经验。

但哈萨比斯最终证明了自己，因为外界看到的更多只是他作为科学家带领AlphaFold的那一面，却忽略了他的游戏行业经历。「如果你让我去做真正有突破性的产品，我会非常兴奋，那本来就是我在游戏行业一直在尝试的事情——每一款游戏都建立在革命性技术之上。」

而想在谷歌这艘庞大战舰里摆脱「创新者的窘境」并不容易，既要保留长期、自由的科学研究能力，又必须以近乎冷酷的速度不断把成果产品化、迭代并推向市场。

哈萨比斯把游戏行业中的「突击队」模式复制到了这里：所有成员共同开发一个统一模型；任何人都能提出优化方案，但只有那些能在排行榜上显著提升模型表现的改动才会被采纳；一切都由数据决定。

外界看到的是Gemini 3.0的成功，但事实上，在更早的2024年9月，谷歌就已用这套方法组建起反击团队，专门应对OpenAI推出的o1推理模型。

当时，谷歌传奇工程师诺姆·沙泽尔（Transformer架构核心发明者之一，后来被谷歌以27亿美元从外部重新请回）与杰克·雷共同负责该项目。筹备会议上，超过250名科学家到场，每人只带一页PPT。原计划招募40名志愿者，结果最终有150人主动报名。现场氛围就是：「这是RL（强化学习），这是DeepMind，我们必须赢下它！」

双方之间的差距在不断缩小。到了2025年秋天，Gemini 2.5 Pro与OpenAI的GPT-5在多项盲测中的表现已非常接近：在长上下文和多模态任务上，Gemini往往更占优势，而GPT-5则在数学推理等任务中更强。

如果要用一个关键词概括哈萨比斯的管理哲学，或许就是不懈（relentless）。「不懈地进步，不懈地发布，不懈地打造创新生产机器。这几乎像是一种悖论——一个持续迭代的创新引擎真的可能存在吗？我认为答案是可以。」

END

← 上一篇：教育部AI+教育新规解读：教育转型三大风向标下一篇：天城大新开微专业：AI赋能城市美学设计 →