推理算力成新瓶颈：OpenAI自研芯片折射的企业AI现状

发布时间：2026-06-25 18:14阅读：2

当企业CIO为AI Agent掏钱时，他们真正购买的是什么？表面来看，是模型能力与API配额。然而实际情况正在转变。OpenAI与博通联手推出自研推理芯片Jalapeño、Google强化Gemini 3.5 Flash的计算机操控功能、Figma实现代码与设计协同的AI协作——这三项举措背后藏着同一议题：企业AI应用角逐已从"谁的模型参数更高"演变为"谁能更迅速、更经济地将推理任务落地生产环境"。换言之，算力供给正替代模型能力，成为制约AI Agent真正落地的核心要素。

6月24日，OpenAI正式公布与半导体巨头博通合作推出Jalapeño——一款专为大语言模型推理任务定制的专用集成电路（ASIC）。该项目的时间节点极为惊人：从最初规划到最终流片交付，只耗费9个月。OpenAI甚至调用自家AI模型来提速芯片设计流程。分工层面，OpenAI承担核心架构设计，博通主导硅片实现与网络硬件支撑，加拿大电子制造商Celestica负责板卡与机架整合。

为何如此紧迫？根源在于推理需求已超越训练需求。过去，企业对AI的关注聚焦于"能否产出足够优质的输出"。如今关注点转向"能否在合理成本与时间内规模化交付推理"。传统GPU架构处理推理任务时能耗比欠佳、数据传输损耗偏高。Jalapeño针对此痛点做了极致优化，通过精细架构设计实现计算、内存与网络资源的均衡配置，使实际利用率显著超越行业通用水准。官方规划在2026年底部署这些芯片，并在后续数年扩充产能。

这意味着什么？意味着OpenAI正从一家"售卖模型API"的公司蜕变为"掌控端到端基础设施"的公司。而这种蜕变的驱动力并非技术雄心，而是成本压力与市场竞争。

同日，Google正式推出Gemini 3.5 Flash，其核心亮点在于将"计算机操作（Computer Use）"从独立模型功能升级为内置工具集。这意味着开发者可直接用Gemini搭建跨浏览器、移动端与桌面环境的AI Agent，无需为不同场景开发多套模型。

在Life Sciences场景中，Gemini 3.5 Flash的测试显示准确率较此前提升96.4%。这一数字本身颇为亮眼，但更关键的是其深层含义：Google借模型能力提升来佐证AI Agent已可接管复杂的跨软件工作流。然而这种能力规模化交付的前提，仍是足够经济且充裕的推理算力。Google自家的TPU已积累多代技术，这是其敢于承诺"24/7个人AI Agent"（新发布的GeminiSpark）的底气所在。

对其他企业而言，他们面对的现实是：模型变强了，但推理成本与部署周期仍是瓶颈。

6月25日，Figma在Config 2026发布Code Layers功能，首次实现代码与设计共存于协作画布。设计团队可直接在Figma中克隆代码库、提取工作流进行测试，无需在多工具间切换。此功能大幅削减了设计师与工程师间的交互成本。

Figma还整合了Claude Code与Codex，支持自定义AI插件与AI生成着色器。表面看，这是一次产品功能迭代。但实质上，Figma正将AI Agent的工作流从"外包给云服务"转为"嵌入产品内"。这样做的好处是降低延迟、保障数据隐私、缩减中间环节。坏处是，Figma本身需承载更多推理计算，这又回归到成本与算力的议题。

企业AI的付费分界线正被重塑。过去两年，企业为AI付费的理由是"模型参数大、能力强"。如今的分界线变为"推理能否快速、低成本、可靠地交付"。这意味着：

工作流完整性成为付费驱动力。Figma将代码层引入设计、Gemini将计算机操作内置模型、OpenAI将推理芯片自主设计——均指向同一目标：让AI Agent的使用方无需在多工具间跳转。这种完整性使企业愿意为一体化方案支付溢价。

部署周期与能耗成为隐性成本。Jalapeño仅用9个月就从设计走到流片，而业界平均周期为18-24个月。这表明算力供应链的加速本身即是一种竞争优势。企业CIO选型时，不仅要审视API单价，还需考量部署周期、能耗比、维护成本。

Jalapeño能否在2026年底如期部署，数据中心是否提速足以支撑企业级推理需求？

Google的GeminiSpark能否真正实现24/7运行而不显著推高成本？

中国企业（字节、腾讯、阿里）是否也在加速自研推理芯片，突破算力垄断？

企业在挑选AI Agent平台时，基础设施成熟度是否已成为首要考量因素？

腾讯MarvisiOS版今日正式上线，完成移动端与PC端全量覆盖。相比单纯的聊天应用，Marvis的跨端远控能力（手机控制多台PC的可视化操作）规避了权限边界问题，但也意味着企业需为这种"代劳权限"承担审计与数据保护成本。这进一步印证了"完整工作流"的价值，但也提醒CIO们在评估AI Agent产品时必须深入审视权限、审计与恢复流程。

机会：掌控推理芯片设计与部署的公司将收获结构性成本优势，可通过降价或提升利润实现市场攫取。同时，封装"完整工作流+可靠基础设施"的产品会吸引付费意愿强的企业用户。

威胁：若芯片供应链被少数公司垄断，中小企业AI落地成本将陡增；若推理成本难以下降，AI Agent的商业化前景将受限。

趋势：算力成为新"数据"——掌控算力即掌控AI应用的命脉。企业AI从"试用工具"迈入"常态部署"的关键不再是模型论文发表或跑分测试，而是基础设施的可靠性与成本结构的透明化。

← 上一篇：Kontron 3U VPX单板：集成AI加速下一篇：中传首届AI时代思政课论坛系列报道(五) →