标签

深度学习大牛Karpathy转投Anthropic:从OpenAI元老到特斯拉AI负责人,为何他看好Claude

发布时间:2026-05-21 03:46来源:微信阅读:10

五月二十日,前特斯拉人工智能主管、OpenAI联合创始人Andrej Karpathy正式宣布加入Anthropic团队,将主导预训练研究工作。这标志着继Ilya Sutskever之后,又一位顶尖AI学者向Anthropic"迁移"。

午后看到这条消息时,我并未感到意外。Karpathy的职业轨迹如同一条清晰的发展脉络——他始终在追寻最具影响力的位置。

2015年,人工智能尚未成为今日的热门话题,他便参与了OpenAI的创建。2017年,自动驾驶正处于技术突破的前夜,他加盟特斯拉担任AI负责人。2023年AI教育成为刚性需求,他又创立了Eureka Labs。

今年,他的目光落在了Anthropic。

这则消息蕴含两个重要信息。首先,Anthropic在预训练领域的布局远超外界预期。预训练是AI能力的基石——模型的中文水平、推理能力、回答准确性,都根源于预训练阶段。邀请Karpathy这样既精通研究又管理过工程团队的人才负责预训练,表明Anthropic不甘于"还不错",而是追求质的飞跃。

其次,AI人才争夺战已迈入白热化阶段。同一天内还有两件事:马斯克诉OpenAI案被陪审团驳回(诉讼时效已过),以及谷歌前CEO施密特在毕业典礼发表AI观点时遭到观众嘘声。大型企业与AI实验室之间的人才流动,正在重塑行业格局。

关注AI技术社区超过三年的朋友,大概率阅读过Karpathy的相关内容。他在斯坦福讲授过CS231n(计算机视觉课程,影响了一代AI工程师),著有《神经网络黑客指南》,随后在特斯拉从零构建了Autopilot的视觉识别体系。

他具备一种罕见的特质:既能发表顶级会议论文,也能产出高质量代码,尤其擅长将复杂概念讲解得通俗易懂。他的"Zero to Hero"系列课程、大语言模型入门教程,在GitHub和YouTube上惠及了众多开发者。

这样的人物选择Anthropic,而非回报更丰厚的创业方向或更轻松的大厂职位,印证了Anthropic在技术路线上的独特吸引力。Anthropic一贯强调"Constitutional AI"(宪法式AI)的安全理念,但Karpathy的加盟表明,他们在核心能力层面的投入与安全研究并重。

一个值得玩味的视角:OpenAI的三位创始人——Sam Altman专注运营管理、Ilya Sutskever专注安全对齐、Karpathy专注工程落地——如今后两位已相继离开。OpenAI流失的不仅是人才,更是一种"多元技术基因"。

从更宏观的视角审视,这并非孤例。

过去半年,AI行业人才流动呈现几个显著趋势:

从科技巨头流向AI实验室。Google Brain和DeepMind的多位核心研究员选择了Anthropic及创业公司。Meta的LLAMA团队也持续面临挖角。大型企业的高薪与稳定,抵不过前沿AI实验室"能训练大模型"的诱惑。

从OpenAI向外辐射。作为最具知名度的AI公司,OpenAI近两年经历了大量核心人才的流失。部分人选择创业(如Cognition AI创始人),部分人加入竞争对手。这未必是坏事——人才溢出说明OpenAI培养体系有效,但客观上确实加剧了行业竞争。

"AI工程师"取代"AI科学家"成为最抢手的岗位。2026年的AI行业,仅有想法远远不够,需要能将想法落地的人。Karpathy正是这类人的典型:既能推导数学公式,也能调试分布式训练代码。

Anthropic今年动作频繁。从发布Claude 4系列模型,到通过"Model Context Protocol"尝试建立AI应用层标准,再到如今招揽Karpathy负责预训练——每一步都很稳健,每一步都在积累"不可替代性"。

预训练研究负责人这一职位,在Anthropic的战略版图中至关重要。当前行业共识是:Scaling Law尚未触及天花板,但"如何scaling"的路线正在分化。是投入更多算力构建更大模型,还是采用更智能的数据策略实现更高效训练?Karpathy的抉择将直接影响Claude 5、Claude 6的能力上限。

有人询问我对Karpathy此次跳槽的看法。坦白讲,这或许是今年AI人才流动中最值得关注的一步。

Karpathy从事过研究、产品和教育。他既理解学术前沿,也深知工程落地的挑战。Anthropic为他提供了一个平台,去打造"下一代模型"的根基——预训练。如果他取得成功,Claude可能不再只是"安全的选择",而是"最强的选择"。

对于整个AI行业而言,这种级别的人才流动,意味着我们距离AGI的路线图,可能又清晰了一些。