AI大牛Karpathy转投Anthropic,助力Claude预训练升级
导读:Karpathy将组建一支新团队,借助Claude自身来加速前沿模型开发中成本最高的环节。
OpenAI联合创始人之一、全球顶尖AI专家Andrej Karpathy于本周一宣布加入Anthropic。对于Claude的开发商Anthropic来说,这无疑是一次关键的人才引进,有助于其在大型语言模型研发领域维持竞争优势。
Karpathy将加入由Nick Joseph领导的Anthropic预训练团队,他将在那里创建一个全新团队,致力于一个引人关注的递归目标:借助Claude自身来加速预训练研究。预训练是构建如Claude这类系统的成本最高的环节,也是计算密集型的阶段,它赋予前沿模型核心知识和能力。找到更快、更高效的方法,可能会重塑整个人工智能行业的经济格局。
在一篇浏览量高达1360万次的X帖子中,Karpathy这样写道,他相信"未来几年在大语言模型(LLM)前沿领域的发展将具有特别重要的意义"。他还补充说,他仍然"对教育充满热情",并计划在适当的时候重拾这项工作。
此次聘用标志着Karpathy职业生涯的圆满结束,他的职业生涯几乎涵盖了现代人工智能的每一个重大转折点。Karpathy在斯坦福大学师从ImageNet背后的计算机科学家李飞飞,获得博士学位,研究方向为深度学习和计算机视觉。2015年,他与其他11位创始人共同创立了OpenAI,并在该公司从事深度学习研究。2017年,他离开OpenAI,加入特斯拉担任人工智能总监。
在特斯拉,Karpathy领导着全自动驾驶和自动驾驶辅助系统的计算机视觉团队,这两个项目是这家电动汽车制造商实现自动驾驶汽车宏伟目标的基础。他于2022年7月离职,之后重返OpenAI工作约一年,随后于2024年再次离开,创立了Eureka Labs,一家将人工智能助手应用于教育领域的初创公司。目前,Eureka Labs的工作已经暂停,Karpathy全力投入Anthropic的研发。
时机颇为耐人寻味。Anthropic已成为顶尖技术人才的聚集地,而其主要竞争对手OpenAI却正经历着一系列高管离职潮。过去两年,OpenAI已流失十几位高级管理人员和研究人员,其中包括首席技术官Mira Murati、强化学习先驱John Schulman,以及最近在2026年4月同一天离职的三位高管。
对Anthropic而言,成功签下Karpathy表明,随着公司研发和商业运营规模的扩大,它有能力吸引最顶尖的人才。这家由首席执行官Dario Amodei领导的公司,估值约为8000亿美元,已引起投资者的广泛关注,据报道,该公司正在考虑首次公开募股(IPO),最早可能在2026年底进行。
Karpathy的新角色也凸显了前沿人工智能领域的一个更广泛趋势:利用现有模型来改进下一代模型。如果Claude能够显著加快自身的预训练流程,这将标志着递归式自我改进的实际应用,而这正是人工智能安全领域长期以来密切关注的能力之一。这一前景究竟会令观察者感到兴奋还是不安,可能取决于他们对Anthropic自成立以来所秉持的安全至上的企业文化的信任程度。
目前看来,Karpathy似乎正处于他最想待的地方:回到技术实验室,在前沿领域构建模型。