OpenAI九个月造芯:AI自驱设计刷新半导体纪录
传统芯片研发,从绘制草图到交付代工厂,往往耗时两至三年。
OpenAI仅用九个月便完成。
大幅压缩这一周期的关键,正是ChatGPT——它参与设计的芯片,最终将由它自身驱动运行。
2026年6月24日,OpenAI携手博通正式推出名为Jalapeño(哈拉贝诺辣椒)的芯片。这不仅是OpenAI首款自主研发的AI推理芯片,更标志着“AI参与设计其运行硬件”首次从概念走向实物。
首先需厘清一个常被忽视的差异。
大语言模型的运作分为两大阶段:训练与推理。
训练属一次性任务——模型吞噬海量文本与数据,习得“表达”能力,此过程虽消耗惊人算力,但完成后即告终结,无需日日重复。
推理则时刻发生——用户每发一条消息,模型便需执行一次计算并生成回复。ChatGPT数亿日活用户背后,是数亿次推理请求,每回均需消耗算力资源。
以往,OpenAI这两项任务均依赖英伟达GPU。GPU在训练环节无可替代,但在“重复且固定”的推理任务上,通用GPU存在算力浪费——因其设计初衷是兼容各类任务,故在单一推理场景下成本效益不佳。
Jalapeño仅专注于推理这一核心任务。
此类针对特定场景定制的芯片称为ASIC(专用集成电路)。虽灵活性较低,但在目标场景内,其单位功耗的算力产出显著提升。博通CEO陈福阳向路透社透露,Jalapeño性能可媲美英伟达Blackwell系列及谷歌TPU。
芯片设计缓慢,非工程师之过。
高性能芯片从架构蓝图到完成流片(交由台积电等代工厂生产),中间需经历反复的“设计→仿真→问题发现→修正→再仿真”循环,每一轮失误若发现越晚,代价越沉重。
OpenAI将循环中的部分环节交由ChatGPT处理。
具体而言,是令AI协助工程师进行代码生成、逻辑错误排查及文档校验,从而减少人工反复对齐的次数。这并非“AI独立绘制整颗芯片”的科幻场景,而是在流水线多个关键节点,AI接替了原本需人工手动操作的工作。
OpenAI将此模式称为“AI辅助造芯”。从设计到流片仅耗九个月,公司宣称这是“高性能先进半导体领域史上最快的ASIC开发周期”。
若AI能助力工程师加速芯片研发,芯片运行AI的成本便可降低,最终让更多人负担得起更优质的AI服务。这一逻辑,OpenAI在公告中已明确阐述。
这并非针对某家特定企业,而是一种长期存在的依赖现象。
OpenAI过往相当长时期的算力,源自微软Azure集群中数以万计的英伟达GPU。在GPU供不应求的数年,这种依赖直接决定了OpenAI能否按时扩容,以及每次推理的成本高低。
头部AI公司“自研芯片”之举,实则早已启动:谷歌拥有TPU,亚马逊推出Trainium,微软发布Maia,Meta亦发布定制AI加速芯片。其背后共同动机一致——降低对英伟达的单点依赖。
OpenAI此前曾是这一阵营中明显缺席者。Jalapeño的问世,使其补全了拼图。
但更值得关注的是其长远意图。OpenAI总裁格雷格·布罗克曼在声明中写道:“我们不仅构建模型,也在打造运行模型的产品;更重要的是,我们正在设计支撑这一切的基础设施——涵盖芯片架构、内存系统、网络、调度、部署直至用户体验。因我们贯穿整个技术栈,每一层皆可围绕同一目标进行优化。”
从模型到芯片,竞争维度正不断下沉。昔日比拼模型能力,如今连芯片亦需自研,节省出的成本可再投入模型研发。
另有一细节值得注意。
Jalapeño不仅由AI辅助设计,其运行对象亦为AI——早期测试中,GPT5.3、Spark等模型均已在其上运行。
AI辅助设计芯片 → 芯片运行更高效 → AI产品体验更优 → 更强大的AI助力设计下一代芯片……
这一循环,过去两三年屡被提及,却止步于概念层面。Jalapeño是首次,在量产节奏中拥有了真实的落地标志。
博通CEO陈福阳称,这是“跨越数代产品路线图的开端”,博通正协助微软及其他合作伙伴,自2026年起部署千兆瓦级数据中心。这非展台上的模型,而是将入驻数据中心正式运转的实体。
Jalapeño目前仍处于测试阶段,详细性能技术报告需待后续数月公布。“单位功耗性能优于现有同类”系OpenAI自述,独立测试结果尚未出炉。
纵观历史,科技企业发布自研芯片至真正大规模替代商业产品,通常非一日之功。谷歌TPU历经十年,在外部商业市场的份额依然有限。九个月是设计速度的纪录,量产、部署及实际落地效果,则是另一课题。
但它确实完成了一项前所未有的壮举:首次借助AI辅助,制造出一颗可流片的高性能推理芯片,并计划于2026年底真实部署至OpenAI服务体系中。
谁将掌控AI运行所依赖的底层硬件?这一问题的答案,正变得愈发不确定。
参考