标签

谷歌AI为何能反超OpenAI?

发布时间:2026-04-10 20:54来源:微信阅读:7

先看其人,再看其事,哈萨比斯逐渐成为奥尔特曼的另一面。

到了2026年,OpenAI的市场份额持续走低,谷歌Gemini与Anthropic的Claude则不断上升。

近期,《哈萨比斯:谷歌AI核心大脑》一书面世,意味着中文读者终于拥有了理解这位谷歌AI关键人物的一手材料。作者马拉比长期与哈萨比斯进行每次两小时的深度交谈,最终将总计30小时的访谈与大量资料整理成这部传记。

这本书不仅描绘了哈萨比斯的精神气质和成长经历,也揭示了他如何带领DeepMind走出一条与OpenAI截然不同的道路:一方以科学研究为中心,沿着更克制、更谨慎的路线前进;另一方则体现出强调速度、崇尚破局的公司文化。

更关键的是,书中将哈萨比斯塑造成「企业家+科学家」的复合形象。这批早期AI探索者切入AI的起点,是科学研究,是对一种新认知形态的哲学追问;而OpenAI的奥尔特曼则代表另一类人,他们把AI视为可以借势而上的风口,因为它能带来影响力与财富。

理解事情之前,先理解人物。

哈萨比斯成长于伦敦的一个移民家庭,5岁时就是国际象棋天才少年,后来在剑桥攻读神经科学。创办DeepMind后,他先以AlphaGo击败人类围棋冠军,又用AlphaFold破解蛋白质折叠问题,并因此获得诺贝尔化学奖。他最终设想中的AI,是一种“无限机器”,能够无限归纳数据,进一步跃升为数学意义上的AGI。

回顾过去15年,谷歌始终是AI世界里最重要的力量之一。

如今全球AI产业中,约90%的关键突破都出自谷歌大脑、谷歌Research或DeepMind,例如AlphaGo、强化学习,以及Transformer架构。按照哈萨比斯过去的设想,AI本应沿着更稳健的研发路径前进,让更多类似AlphaFold的成果应用在癌症治疗、新能源和新材料等领域,真正惠及人类。

然而现实并未按设想展开,技术演进往往难以预料。OpenAI率先把大模型的对话与生成能力推向大众市场,谷歌则在一度落后的局面下迅速追赶,通过组织重整打造Gemini 3.0,最终将其在全球通用AI流量市场中的份额提升至21.5%,而ChatGPT则从86.7%降至64.5%。

而哈萨比斯,正是解读谷歌AI能力版图的关键人物之一。

《哈萨比斯:谷歌AI核心大脑》中,也公开了不少科技史背后的细节。

例如当年谷歌收购DeepMind时,Facebook的扎克伯格其实报出了更高价格,但哈萨比斯依旧选择谷歌。原因在于,他看重的是人,而不是出价。扎克伯格并没有展现出对AGI长期愿景的深刻理解,而谷歌联合创始人拉里·佩奇显然更懂这一点。

「他当时其实是在对我说,也许你完全可以打造一家像谷歌那样的公司,但那会耗掉你职业生涯里最宝贵的时光,」哈萨比斯回忆拉里·佩奇时说道,「可如果我真正的目标是构建通用人工智能,那为什么不直接使用他已经积累起来的全部资源?我觉得这个说法很有说服力。」

2014年1月底,谷歌以6.5亿美元完成对DeepMind的收购,以今天的眼光来看,这笔交易堪称超值。

但对哈萨比斯而言,真正重要的收获,是此后十年里谷歌向DeepMind持续投入了数十亿美元研究经费。自少年时代起他就怀有的超级智能理想,也因此迅速进入快车道。

后来哈萨比斯虽然进入谷歌核心管理层,却一直住在伦敦而非硅谷,因为在他看来,英国社会比硅谷更平衡,他也不愿彻底被硅谷那种逐利文化所同化。

哈萨比斯虽然与硅谷长期合作,也接受了它的资本支持,但始终保持某种距离。在和马拉比的交流中,他直言批评那些把利润、速度和市场主导地位放在第一位的企业掌舵者,认为这种取向过于「短视、逐利」。

事实上,DeepMind与谷歌之间也曾爆发治理和权力上的冲突。DeepMind内部一度不满谷歌在AI治理与安全监督上的控制方式,他们担心未来AGI的部署会完全被商业利益主导,而不是由安全与伦理原则决定,因此希望为DeepMind建立一套独立于谷歌商业董事会的治理结构。

但这个代号为「Project Mario」的秘密拆分计划最终未能实现,因为谷歌无法接受外部独立人士对其核心专有技术拥有否决权。DeepMind联合创始人苏莱曼也因此离开,后来转而担任微软AI负责人。

这是外界首次较完整地看到DeepMind与谷歌内部权力博弈的全貌。

这段经历也促使哈萨比斯发生转变。他开始由一个理想主义者走向现实主义者,因为他明白,在一家以盈利为目的的企业中,过于理想化的去信任化治理结构(trustless governance structures)根本无法落地,真正可行的道路,是在公司内部获取实际权力。

更重要的是,在这本传记中,哈萨比斯被塑造成奥尔特曼的反向样本:AI应服务于科学启蒙,而不是权力和财富。这也是理解哈萨比斯与奥尔特曼差异的一个重要入口。

奥尔特曼被描绘成一个更看重权力与财富的AI领导者,而哈萨比斯则是科学家+企业家的结合体。这不仅仅是公众形象上的不同,更是底层价值判断和发展逻辑上的根本区别。

奥尔特曼深知硅谷的竞争法则,产品必须抢先一步进入市场,这几乎是生存级要求。最能体现他权力欲的,或许是导师格雷厄姆那句评价:山姆极其擅长获得权力,你把他空投到一个食人族岛上,五年后再回来,他已经成了国王。

这也解释了为什么DeepMind在大语言模型上曾一度落后于OpenAI,因为哈萨比斯始终坚持「科学优先」的神经科学路线,对大语言模型一直保持怀疑态度。他做这件事首先是为了知识与科学,而不是市场。

在近期采访中,哈萨比斯也对行业格局和未来趋势给出不少判断。比如他认为开源模型永远会慢前沿一代,头部之间的竞争差距会继续扩大,未来整个行业需要建立一个国际性合作组织。

他判断,目前全球最顶尖的三到四家实验室,与其他所有机构之间的差距,正以两年前完全看不到的方式持续拉大。这背后的原因是结构性的,并不只是因为它们投入了更多资金。

「缩放定律、Transformer架构、人类反馈强化学习流程」,这些当下主流技术路径已经被广泛传播,也被大量复现。它们的边际收益正在减弱,那些仅仅擅长熟练运用既有技术的机构,正在逐步逼近增长上限。接下来决定胜负的,不是谁把已知技术执行得更高效,而是谁能创造出下一代算法。

同时,AI工具本身也在推动下一代系统的研发提速。代码助手让研究者更快迭代模型架构;数学推理工具帮助验证新模型的特征。前沿实验室不只是沿着同一赛道跑得更快,而是在重新定义赛道本身。

「要从同一套技术路线中继续挖出相同水平的收益,正变得越来越困难。所以我相信,未来几年里,能够提出全新算法思路的实验室,会获得更明显的领先优势——因为上一代思路的潜力已经几乎被彻底榨干。」

在开源议题上,哈萨比斯的态度是谨慎而清晰的:开源模型将始终比最前沿模型大约慢一代。

这并不是因为开源社区缺少天赋或投入,而是因为追赶本身需要时间。前沿实验室一旦发表新的突破,开源社区往往需要大约半年时间,才能完成复现、深入理解并高质量实现;而在这半年里,前沿实验室并不会原地等待。

这种差距不会真正消失,它只会不断向前移动。

DeepMind对此给出的方案,是推出自己的Gemma系列模型:一种轻量级开源模型,目标不是硬碰绝对前沿,而是在相同规模下做到最强。

因此,哈萨比斯对Gemma的目标用户有非常清晰的界定:包括缺乏大规模算力基础设施的早期开发者、算力有限的学术研究人员、不愿依赖API的创业团队,以及必须进行本地部署的边缘计算场景。他认为,对于这些使用情境来说,开源模型并非退而求其次,很多时候反而是更合适的方案。

关键在于,外界必须清楚它的定位和边界。

另一个更重要的问题是,当被问及当前AI行业有哪些方面低于当年预期时,哈萨比斯指出,持续学习(continual learning)仍然是明显短板。这些系统在训练完成、部署到真实环境之后,往往就停止继续学习了,模型在增量学习和持续吸收新知识方面依然很弱。

「因为整个行业还没有真正找到成熟可行的方法,所有头部实验室都在研究,如何把新知识整合进那些已经训练了数月的成熟系统之中。而人类大脑在这方面却做得非常自然,极有可能依赖睡眠、强化学习等机制。」

此外,当前AI的发展仍有许多障碍需要跨越,其中最大的一个问题也许是一致性(consistency)。「我有时把这些系统称作‘锯齿状智能’(jagged intelligence),因为它们在某种提问方式下表现惊艳,但只要问题表达稍有变化,就可能在很基础的地方犯错,真正的通用智能不应该存在这种缺陷。」

组织层面的变化往往先于产品层面的变化,而组织能力的重塑进一步推动了技术跃迁,这正是谷歌Gemini后来实现反超的重要原因。

去年11月中旬,谷歌发布Gemini 3.0模型,凭借其在推理和多模态能力上的强势表现,给ChatGPT带来了巨大压力。一个核心原因就在于更早之前,谷歌DeepMind与谷歌大脑这两个AI团队已经完成合并,哈萨比斯出任新部门负责人,而原谷歌大脑负责人杰夫·迪恩则担任新团队首席科学家。

团队的调整是一切变化的起点。哈萨比斯后来表示:「我们把公司分散在全球的人才整合起来,朝着同一个目标推进;同时,我们把所有算力资源集中起来,用于打造最大规模的模型,而不是在公司内部同时分散做两三个版本。

很大程度上,我们只是把原本已有的优势重新拧成一股绳,然后以创业公司般极致聚焦的节奏和强度全速推进,让我们重新回到前沿,并在多个方向取得领先。」

事实上,在当时外界并不完全看好哈萨比斯,因为谷歌大脑负责人杰夫·迪恩看起来拥有更强的产品经验。

但哈萨比斯最终证明了自己,因为外界看到的更多只是他作为科学家带领AlphaFold的那一面,却忽略了他的游戏行业经历。「如果你让我去做真正有突破性的产品,我会非常兴奋,那本来就是我在游戏行业一直在尝试的事情——每一款游戏都建立在革命性技术之上。」

而想在谷歌这艘庞大战舰里摆脱「创新者的窘境」并不容易,既要保留长期、自由的科学研究能力,又必须以近乎冷酷的速度不断把成果产品化、迭代并推向市场。

哈萨比斯把游戏行业中的「突击队」模式复制到了这里:所有成员共同开发一个统一模型;任何人都能提出优化方案,但只有那些能在排行榜上显著提升模型表现的改动才会被采纳;一切都由数据决定。

外界看到的是Gemini 3.0的成功,但事实上,在更早的2024年9月,谷歌就已用这套方法组建起反击团队,专门应对OpenAI推出的o1推理模型。

当时,谷歌传奇工程师诺姆·沙泽尔(Transformer架构核心发明者之一,后来被谷歌以27亿美元从外部重新请回)与杰克·雷共同负责该项目。筹备会议上,超过250名科学家到场,每人只带一页PPT。原计划招募40名志愿者,结果最终有150人主动报名。现场氛围就是:「这是RL(强化学习),这是DeepMind,我们必须赢下它!」

双方之间的差距在不断缩小。到了2025年秋天,Gemini 2.5 Pro与OpenAI的GPT-5在多项盲测中的表现已非常接近:在长上下文和多模态任务上,Gemini往往更占优势,而GPT-5则在数学推理等任务中更强。

如果要用一个关键词概括哈萨比斯的管理哲学,或许就是不懈(relentless)。「不懈地进步,不懈地发布,不懈地打造创新生产机器。这几乎像是一种悖论——一个持续迭代的创新引擎真的可能存在吗?我认为答案是可以。」

END