标签

OpenAI首发智能芯片Jalapeño,9个月完成流片,专为AI推理而生

发布时间:2026-06-25 09:10阅读:3

OpenAI 携手 Broadcom(纳斯达克代码:AVGO)正式推出 Jalapeño,这是 OpenAI 自主研发的首款智能处理器。该芯片作为一款加速器,围绕 OpenAI 对大语言模型推理的长远设想进行架构设计,也是双方共同打造的多代计算平台中的第一代 AI 加速器,旨在让前沿 AI 更高效、更稳定,并触达更广泛的用户群体。

OpenAI 与 Broadcom 高管展示 Jalapeño 推理芯片。

Jalapeño 已由 Broadcom 首席执行官 Hock Tan 和总裁 Charlie Kawwas 交付给 OpenAI 首席执行官 Sam Altman 和总裁 Greg Brockman,标志着 OpenAI 在构建全栈计算生态战略上迈出关键一步。

OpenAI 从零开始设计这颗芯片,依托其对大语言模型底层机制的深入洞察,并结合模型、内核、推理系统及产品需求的演进路径。Broadcom 与 Celestica 提供支撑,协助完成芯片落地、板级设计、机架系统整合、高性能网络及可扩展生产系统。

Jalapeño 的设计具备高度适应性,可兼容各类大语言模型,并针对 OpenAI 对当下及未来 AI 模型推理需求的理解进行调优。

目前,Jalapeño 工程样片已在实验室中以生产目标频率和功耗运行机器学习负载,其中包括 GPT-5.3-Codex-Spark。

尽管 OpenAI 仍在评估最终性能,但初期测试显示,Jalapeño 在单位功耗性能上将大幅超越现有领先技术。详细技术报告将在未来数月内公布。

该架构通过减少数据移动,并在计算、存储与网络资源间实现更佳平衡,使实际利用率更贴近理论峰值性能。

Broadcom 的芯片实现与网络技术(包括 Tomahawk 网络芯片)助力该平台实现规模化部署。

Jalapeño 是一款为现代大语言模型推理量身打造的“从零设计”平台,而非从早期 AI 负载演化而来的通用型加速器。

其设计根植于 OpenAI 在 ChatGPT、Codex、API 及未来智能体产品中的日常运营经验,同时也面向行业当前及未来的大语言模型。

目标是融合当前主流 AI 加速器的算力与吞吐能力,同时达成接近最快专用推理系统的低延迟,使 Jalapeño 非常适用于大规模交互式大语言模型产品。

这就是所谓的“全栈优势”。OpenAI 不仅在开发前沿模型或构建上层产品,更在设计底层基础设施:芯片架构、内核、内存系统、网络、调度、部署系统及产品体验。

由于 OpenAI 掌控整个技术栈,每一层都可围绕同一目标进行优化:让模型以更快、更可靠、更低成本服务用户。

Jalapeño 强化了 OpenAI 的“飞轮效应”:

更优的基础设施提升算力效率;更高的算力效率提升训练与推理能力;更强的模型驱动更佳产品;更佳产品带来更多用户、客户与收入;这些收入又反哺下一代基础设施。

长远来看,这一循环将使智能更强大、更可靠,并以更低成本惠及所有人。

Jalapeño 从初始设计到制造流片仅耗时九个月,这一定制 AI 加速器项目被视为高性能先进半导体领域中最快的 ASIC 开发周期之一。

通常来说,先进半导体行业设计一颗高性能 ASIC 需要 18 到 24 个月。Google TPU 两年迭代一次,Amazon Trainium 的节奏也大致相当。

而 OpenAI 仅用九个月,一举刷新了先进半导体领域最快的 ASIC 开发周期。

这颗芯片从第一根连线起就只为一个目标优化:大语言模型推理。

而且,Jalapeño 不仅运行 OpenAI 自家模型,架构上兼容全行业的大语言模型。

这一速度源自 OpenAI 工程团队与 Broadcom 在硅实现上的深度协作,以及利用 OpenAI 模型加速设计与优化流程。

同样用于服务用户的模型,也在助力改进未来芯片的设计。如果 AI 能帮助工程师更快设计更优芯片,将降低整个行业的计算成本,并推动先进 AI 的普及。

Jalapeño 是多代计算平台的第一步,该平台计划在 2026 年底前进行初始部署,并在未来数年持续扩展。

该平台融合 OpenAI 设计的加速器、Broadcom 的芯片实现与网络连接技术,以及 Celestica 在板卡、机架和系统方面的工程能力。

这项工作的核心极为简单:推理是 AI 触达用户的关键环节。

每一次在成本、速度与可靠性上的提升,都可能体现为:

更快的 ChatGPT 响应、更能执行多步骤任务的 Codex、更经济的 API 产品,或在高负载下更稳定的服务。

让 AI 普及意味着:使先进模型足够可用、可靠且经济,让更多人能每日使用它。

Jalapeño 正帮助 OpenAI 将更多基础设施转化为可用的智能能力,服务学生、开发者、小型企业、研究人员、企业以及所有学习、创造或解决复杂问题的人。