标签

新AI实验室的崛起与挑战

发布时间:2026-05-25 02:43来源:微信阅读:7

2026 年 5 月 6 日,Menlo Ventures 合伙人 Deedy Das (@deedydas) 公布了他自 2025 年 11 月以来持续收集的市场版图,内容简短但列表详尽,核心数据如下:

这 63 家初创公司总市值约 3000 亿美元,全部处于产品市场匹配(PMF)之前,且几乎都以极高的估值(通常为独角兽或更高)进行融资,专注于长期突破。

这些公司被称作新一代实验室(Neolabs)。

等等,什么是 Neolab?

Deedy 的定义是:

Neolabs 是一种 AI 研究实验室,通常由来自顶级 AI 实验室的精英研究员、教授或已实现财务自由的企业家创立。它们在产品市场契合前且营收规模极小,但以极高(通常是独角兽级别以上)的估值融资,专注于长期突破。

在他追踪的前十家公司中,有九家在种子轮估值就超过 10 亿美元,但营收可能低于 1000 万美元,它们都由前前沿实验室的研究员创立,其中大部分人已经积累了 1000 万甚至 1 亿美元以上的财富。

在这一代创始人看来,做一个月活千万的 App 是平庸的商业行为;拥有一个能自主改变物理规律认知、改写数学底层逻辑的模型能力,才是终极且唯一的护城河。

我们正在进入一个“研究即产品,能力即估值”的纪元。

例如:

- Roze(约 1000 亿美元,2026 年,机器人)

——据报道,孙正义正准备将其上市的软银精心策划的 AI/机器人IPO工具,专注于机器人建造的数据中心。

- Thinking Machines Lab(约 500 亿美元,2025 年,前沿实验——前 OpenAI 核心成员 Mira Murati 离职创立的公司,持有硅谷历史上最大规模的种子轮融资记录。

- Project Prometheus(>380 亿美元,2025 年,机器人)——杰夫·贝佐斯在实体经济领域的押注。

——Ilya Sutskever 创立的机密优先、纯研究导向的实验室。

- Reflection AI(>250 亿美元,2024 年)——由前 DeepMind 成员开发的分发开源前沿模型。

- Skild AI、Physical Intelligence、Periodic Labs、World Labs、AMI Labs、Inflection AI、Hark、Recursive Superintelligence——估值均在 40 亿至 150 亿美元之间;几乎全部成立于 2024 平台之后。

名单最底部的 Sooth Labs 估值为 3.35 亿美元——这是入选该名单的最低门槛。

你问,为什么大家如此关注Neolabs?

因为,Anthropic,就是做出那个 claude code,claudedesign 等的公司,在 2021 年也曾是一家 Neolab。

当时,Dario 和 Daniela Amodei,因为在人工智能安全(AI Safety)的理念和实现路径上与 OpenAI 管理层存在分歧,就带着一个小团队离开了 OpenAI 成立了 Anthropic.

貌似这个分歧直到现在也没有解决 ;-(

Anthropic 在产品问世前以独角兽估值融资,

并在发布 Claude 之前花了两年时间做研究。

到 2026 年,该公司的 ARR 达到 300 亿美元,

估值有望在下半年超越 OpenAI。

如果你在 2021 年对 Anthropic 套用看空理由——“嗨,不就是又一个 GPT 衍生品嘛?没产品、又没护城河、指不定人才会被挖回去”——你就会错过这十年中最大的宝藏之一。

所以,新一代的 Neolabs 的押注者是有看多点理由的,主要有这几点:

1,周期的模式识别。

每一次范式转移技术都会催生一波估值看起来不可理喻的营收前初创公司,直到赢家出现。

互联网催生了亚马逊、谷歌、Salesforce——而剩下的 95% 都失败了。

移动互联网催生了 Uber、Instagram、WhatsApp——而剩下的绝大多数都失败了。

不对称性在于,幸存者的体量如此巨大,以至于回过头来看,它们证明了整个投资组合的合理性。

当红辣子鸡 Anthropic 的估值增长变化

这也是 VCs 经常说的,

押注赛道,而不仅是公司。

2,结构性转变。

这一观点认为 AI 是真正的通用技术,可与电力或内燃机相媲美,而我们正处于其经济影响的前 10%。

如果这是正确的,那么即使个别 Neolabs 失败,目前的估值相对于 AI 原生公司最终的价值来说依然是偏低的。

这场赌局不是赌 63 家全部成功,而是赌其中几家将成为万亿级公司,剩下的则是为购买这种可能性的期权而付出的成本。

这里我们提出一个几乎没有任何媒体使用过的框架——

Neolabs 是期权,而非股权。

当你以 10 亿美元估值在产品问世前的种子轮签下一张 100 万美元的支票时,你买的并不是任何有意义经营意义上的股权,你买的是一个期权,赌该团队在未来不确定的时间点产生实质性推进前沿的研究突破的能力。

期权的行权价是下一轮的估值;到期时间大约是 18-36 个月;底层波动率巨大,因为大多数尝试将彻底失败,而少数几次将产生多大数百亿美元的回报。

由此我们可以有三个推论:

1)看空理由是基准概率,而基准概率已经定价。

如果你将每个 Neolab 视为一个期权,那么“大多数会失败”完全等同于“大多数期权到期归零”,这在所有期权账本中都是事实。

问题不在于失败率是否高,而在于隐含波动率(实际上是右尾的大小)是否足够高以补偿风险。

对于前沿 AI,右尾是“万亿级公司”,这几乎肯定能补偿。

2)投资者和员工的经济学在结构上是不对称的。

持有 63 家 Neolabs 组合的投资者分散了期权账本;一两个超常的赢家能覆盖所有成本。

而 Neolab 的员工不具备这种对冲——他们持有一个高度集中的仓位,归零概率极高,且股权缺乏流动性市场。

这就是为什么 Meta 和 OpenAI 能反向人才收购 Thinking Machines。Neolabs 结构是脆弱的,因为它依赖于员工持有那些在个体层面风险回报比极差的期权。

3)时间衰减(Theta)是最大的敌人。

期权会衰减。

Neolabs 也会。

每一个没有研究成果产生的月份都会降低右尾结果出现的概率,并给人才池更多离开的理由。那些能够成功的实验室,是那些在最初 12-18 个月内产生了一些成果——一篇论文、一个基准测试结果、一个可运行的制品——来重新锚定团队对右尾仍然存在的信心的实验室。

3, Neolabs 具有真正差异化。

哪怕你不是内行,你也会看到,

名单上的实验室并不是 GPT 模仿者。

比如,Periodic 的负面数据飞轮——拥有唯一的大规模物理实验失败数据源——是其他任何公司都没有的可防御资产。World Labs 的空间智能赌注是一场开辟类别的博弈。Goodfire 对可解释性的关注在前沿规模上确实供应不足。Liquid 的连续时间网络架构是 Transformer 之外一个不可忽视的替代方案。

这些 Neolabs 最大的价值就是他们的独特性。

但这里我们要提一点,

差异化真的是那么值得买单的价值么?

或者,让我们退一步来问,

这些 neolabs 究竟是一种研究实验室、一家初创公司,还是一家产品公司?

我们思考后的答案是——

它在结构上同时是这三者,这是一种新型实体。

贝尔实验室(Bell Labs)和施乐帕克研究中心(Xerox PARC)——每个人都会想到的历史类比——是盈利母公司的研究部门。他们不需要融资;他们可以进行长达数十年的纯粹的研究型工作,于是他们产生了非凡的结果(晶体管、激光、GUI、以太网),但很大程度上无法捕捉这些结果的商业价值。

这种失败是众所周知的教训。

贝尔实验室(Bell Labs)

所以,Neolab 不能是 AI 时代的贝尔实验室(Bell Labs),Neolab 需要同时是研究组织、初创公司和(未来的)产品公司——

你不能将研究与产品化分开,发现新算法的团队也必须是交付产品的团队,否则价值就会流失。

OpenAI 本身就是对此最清晰的验证:

GPT 是一个变成了产品的研究项目,研究团队和产品团队多年来一直是同一拨人。

但请注意,这里存在一种张力,这种张力正是导致大多数 Neolabs 失败的原因,那就是——

研究和产品化优化的目标不同。

研究追求新颖、令人惊讶、改变范式的工作,通常需要数年才能实现。

产品追求执行、迭代、客户反馈和出货速度。

尝试在一个 20 人的团队中同时完成这两件事,要么需要一位异常天才的创始人(Thinking Machines 的 Murati、SSI 的 Sutskever、Anthropic 的 Amodei),要么更常见的情况——会导致最终的碎片化,研究团队和产品团队的目标发生分歧,实验室在两个方面都变得效率低下。

这是许多 Neolabs 将失败的隐藏原因,不是定位,不是差异化,不是资本,不是人才,不是市场——而是将研究实验室和初创公司作为同一个组织运行的结构性难度。

Anthropic 解决了这个问题。

但大多数公司解决不了。

进一步,

一个更深层的问题(目前我们也没有答案)是,

前沿 AI 研究的正确结构究竟是什么?

是像 deepmind 这样,盈利母公司内部的研究组织,不受季度产品压力干扰,自由地进行投机性工作。过去十年的大多数伟大成果——AlphaFold、AlphaGo、ImageNet、Transformer 注意力机制——都来自这种结构?

还是像 ChatGPT 的结构(研究-产品融合)?

目前数据点太少,我们没有办法排除这可能是对单一数据点的幸存者偏差。

上面说到,这 63 家公司不是在做同一件事情,我们通过对名单的深度扫描,大概可以分出六种范式:

1,前沿通用实验室

(Frontier-general labs)

像 Thinking Machines Lab、SSI、ReflectionAI、Humans&、AMI Labs、Recursive Superintelligence、Core Automation、AAI、Reka、Mirendil 就是其代表。

它们相信:前沿通用智能仍是无主之地。一个由研究驱动的小型团队可以通过更好的算法、更好的后训练,来追赶 OpenAI/Anthropic/Google。Mira Murati 曾说:由不透明 API 和庞大团队组成的前沿实验室模式并非唯一路径;定制化、可解释性和开源权重基础模型可以实现绕道超车。

2,机器人与具身智能

(Robotics and embodied AI)

代表是 Roze、Project Prometheus、Skild AI、PhysicalIntelligence、Rhoda AI、Genesis AI。

它们的论点是:语言问题已经基本解决;下一个阶段是在现实世界中采取行动。

在这些 Labs 中,Roze 比任何人都走得更远——它的核心卖点甚至不是机器人产品,而是机器人驱动的数据中心建设,这被宣传为打破美国建设劳动力瓶颈、释放 AI 建设潜力的唯一途径。据报道,美国短缺约 43.9 万名建筑工人,卫星图像分析显示,多达 40% 的 AI 数据中心项目面临延迟风险。如果你相信劳动力墙是真实且持久的,Roze 或许就是该类别的唯一玩家。

3,AI 科学

(AI for science)

Periodic Labs、Lila Sciences、Chai Discovery、Xaira Therapeutics、Evolutionary Scale、Isomorphic Labs、CuspAI。

它们的出发点是:互联网规模的训练数据已经枯竭;下一次突破需要让 AI 能够通过闭环自主实验生成新鲜的物理数据。

Periodic Labs 对这一论点的阐述最为清晰——Liam Fedus(前 OpenAI 联合开发者)和 Ekin Dogus Cubuk(前 DeepMind 材料主管)筹集了 3 亿美元,用于建造能够自主提议并运行材料发现实验的机器人实验室。互联网上的文本已被耗尽,物理世界的实验数据(尤其是未发表的失败数据)才是通向物理模型唯一的阶梯。

4,世界模型

(World models)

代表是 World Labs(李飞飞)、Decart、AMI Labs(LeCun)、General Intuition。

World Labs 在 2025 年底发布了 Marble——一个生成式可探索环境的研究预览。AMI 正在以十亿美元的规模测试 Yann LeCun 提出了十年的 JEPA 论点。它们相信:AI 必须理解三维空间和因果关系。这是通往机器人时代的前提。

5,前沿高效 / 异构架构

<41009494>