标签

OpenAI计划开源调度软件,打破英伟达软件生态壁垒

发布时间:2026-06-02 17:38来源:新浪新闻阅读:3

OpenAI 的算力主管萨钦・卡蒂在接受访谈时提到,他们正在考虑开源一款能够适配多种芯片的调度工具。这一举动可能会打破英伟达目前赖以生存的软件核心优势。

本次对话的参与方包括专栏作家、Amp 创始人安杰尼・米达,以及来自 SemiAnalysis 机构的半导体数据中心行业专家杰雷米・埃利亚乌・翁蒂韦罗斯。

访谈主要讨论了 AI 企业如何跨品牌服务器芯片以及跨云服务商部署算力的问题。OpenAI、Anthropic 和 Meta 都不愿在核心算力上过度依赖单一供应商,因为单一厂商无法满足他们巨大的算力需求。

卡蒂指出:“未来的算力市场肯定会走向多芯片异构混合使用的模式。”

过去几年,OpenAI 的算力几乎全部依赖英伟达,但最近他们已开始与亚马逊、赛雷布拉斯(Cerebras)和 AMD 等公司合作,引入自研 AI 芯片,同时也正在开发自己的定制芯片。当被问及是否会像 Anthropic 和 Meta 那样采用谷歌的芯片时,卡蒂没有直接回答。

在不同的硬件架构上开发和运行大型 AI 模型门槛很高,工程师必须深入了解底层硬件细节。

卡蒂解释说,OpenAI 正在开发一种抽象层软件,使研发和产品团队能够在部署业务时忽略底层服务器硬件的具体型号。谷歌过去曾使用类似的硬件抽象调度软件(如 Borg 算力管理系统)来实现业务规模化。“我们现在正沿着同样的路径来落地 AI 算力架构。”

米达警告说,如果 OpenAI 开源这种跨英伟达、谷歌、AMD 等全品类芯片的 AI 调度软件,将对现有的行业格局产生颠覆性影响。

当被问及开源的可行性时,卡蒂确认该计划已被列入备选方案。

“我们希望将这种智能调度优化能力向全行业开放,即智能体优化技术,”他说,但没有详细说明具体的实施方式或时间表。

这一表态引起了市场的极大关注:英伟达长期以来依赖 CUDA 闭源生态系统(包括编译器、库和硬件优化工具)来构建其行业护城河,这是其垄断 AI 芯片市场的关键。卡蒂认为,利用 AI 生成多硬件适配优化代码将逐渐瓦解 CUDA 的垄断优势。

“我们正在利用 AI 生成硬件优化内核代码,以实现所有类型芯片的兼容部署。”

目前,许多开源软件正在分流 CUDA 生态系统:Meta 开源的 PyTorch 框架大幅降低了跨芯片代码开发的难度,许多初创公司还推出了代码编译工具,可以将 PyTorch 高层代码转换为适配各种芯片的底层指令。

关于英伟达新一代 Vera Rubin 芯片的最新进展

座谈会还透露了 OpenAI 准备对接英伟达新一代 Vera Rubin 芯片集群的进度。

卡蒂透露,OpenAI 已经拿到了该芯片的工程样片,计划在今年年底上线用于大模型训练。英伟达从上一代 Blackwell 芯片的部署故障中吸取了教训:由于网络、固件和布线设计复杂,初代 Blackwell 导致各大云厂商的规模化部署屡屡受阻,但后续迭代版本的故障问题有了显著改善。

“英伟达妥善解决了量产过程中的各种磨合问题,值得称赞。”

卡蒂没有透露首批 Vera Rubin 算力集群将部署在哪家云服务商,只表示微软、甲骨文和亚马逊等主要服务商正在积极竞标首批名额,竞争非常激烈。

他还补充说,目前扩充算力的最大瓶颈不是芯片产能,而是配套供电基础设施和新硬件上线所需的工程实施难度。

“目前,电力供应和工程实施能力才是限制算力扩张的关键因素。”

责任编辑:郭明煜

新浪财经声明:本消息转载自合作媒体。新浪财经登载此文旨在提供更多信息,文章内容仅供参考,不构成投资建议。

郑重声明:1. 根据《证券法》规定,禁止编造、传播虚假或误导性信息,扰乱证券市场;2. 用户在本社区发表的所有资料和言论仅代表个人观点,与本网站立场无关,不构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。