推理算力成新瓶颈:OpenAI自研芯片折射的企业AI现状
当企业CIO为AI Agent掏钱时,他们真正购买的是什么?表面来看,是模型能力与API配额。然而实际情况正在转变。OpenAI与博通联手推出自研推理芯片Jalapeño、Google强化Gemini 3.5 Flash的计算机操控功能、Figma实现代码与设计协同的AI协作——这三项举措背后藏着同一议题:企业AI应用角逐已从"谁的模型参数更高"演变为"谁能更迅速、更经济地将推理任务落地生产环境"。换言之,算力供给正替代模型能力,成为制约AI Agent真正落地的核心要素。
6月24日,OpenAI正式公布与半导体巨头博通合作推出Jalapeño——一款专为大语言模型推理任务定制的专用集成电路(ASIC)。该项目的时间节点极为惊人:从最初规划到最终流片交付,只耗费9个月。OpenAI甚至调用自家AI模型来提速芯片设计流程。分工层面,OpenAI承担核心架构设计,博通主导硅片实现与网络硬件支撑,加拿大电子制造商Celestica负责板卡与机架整合。
为何如此紧迫?根源在于推理需求已超越训练需求。过去,企业对AI的关注聚焦于"能否产出足够优质的输出"。如今关注点转向"能否在合理成本与时间内规模化交付推理"。传统GPU架构处理推理任务时能耗比欠佳、数据传输损耗偏高。Jalapeño针对此痛点做了极致优化,通过精细架构设计实现计算、内存与网络资源的均衡配置,使实际利用率显著超越行业通用水准。官方规划在2026年底部署这些芯片,并在后续数年扩充产能。
这意味着什么?意味着OpenAI正从一家"售卖模型API"的公司蜕变为"掌控端到端基础设施"的公司。而这种蜕变的驱动力并非技术雄心,而是成本压力与市场竞争。
同日,Google正式推出Gemini 3.5 Flash,其核心亮点在于将"计算机操作(Computer Use)"从独立模型功能升级为内置工具集。这意味着开发者可直接用Gemini搭建跨浏览器、移动端与桌面环境的AI Agent,无需为不同场景开发多套模型。
在Life Sciences场景中,Gemini 3.5 Flash的测试显示准确率较此前提升96.4%。这一数字本身颇为亮眼,但更关键的是其深层含义:Google借模型能力提升来佐证AI Agent已可接管复杂的跨软件工作流。然而这种能力规模化交付的前提,仍是足够经济且充裕的推理算力。Google自家的TPU已积累多代技术,这是其敢于承诺"24/7个人AI Agent"(新发布的GeminiSpark)的底气所在。
对其他企业而言,他们面对的现实是:模型变强了,但推理成本与部署周期仍是瓶颈。
6月25日,Figma在Config 2026发布Code Layers功能,首次实现代码与设计共存于协作画布。设计团队可直接在Figma中克隆代码库、提取工作流进行测试,无需在多工具间切换。此功能大幅削减了设计师与工程师间的交互成本。
Figma还整合了Claude Code与Codex,支持自定义AI插件与AI生成着色器。表面看,这是一次产品功能迭代。但实质上,Figma正将AI Agent的工作流从"外包给云服务"转为"嵌入产品内"。这样做的好处是降低延迟、保障数据隐私、缩减中间环节。坏处是,Figma本身需承载更多推理计算,这又回归到成本与算力的议题。
企业AI的付费分界线正被重塑。过去两年,企业为AI付费的理由是"模型参数大、能力强"。如今的分界线变为"推理能否快速、低成本、可靠地交付"。这意味着:
工作流完整性成为付费驱动力。Figma将代码层引入设计、Gemini将计算机操作内置模型、OpenAI将推理芯片自主设计——均指向同一目标:让AI Agent的使用方无需在多工具间跳转。这种完整性使企业愿意为一体化方案支付溢价。
部署周期与能耗成为隐性成本。Jalapeño仅用9个月就从设计走到流片,而业界平均周期为18-24个月。这表明算力供应链的加速本身即是一种竞争优势。企业CIO选型时,不仅要审视API单价,还需考量部署周期、能耗比、维护成本。
Jalapeño能否在2026年底如期部署,数据中心是否提速足以支撑企业级推理需求?
Google的GeminiSpark能否真正实现24/7运行而不显著推高成本?
中国企业(字节、腾讯、阿里)是否也在加速自研推理芯片,突破算力垄断?
企业在挑选AI Agent平台时,基础设施成熟度是否已成为首要考量因素?
腾讯MarvisiOS版今日正式上线,完成移动端与PC端全量覆盖。相比单纯的聊天应用,Marvis的跨端远控能力(手机控制多台PC的可视化操作)规避了权限边界问题,但也意味着企业需为这种"代劳权限"承担审计与数据保护成本。这进一步印证了"完整工作流"的价值,但也提醒CIO们在评估AI Agent产品时必须深入审视权限、审计与恢复流程。
机会:掌控推理芯片设计与部署的公司将收获结构性成本优势,可通过降价或提升利润实现市场攫取。同时,封装"完整工作流+可靠基础设施"的产品会吸引付费意愿强的企业用户。
威胁:若芯片供应链被少数公司垄断,中小企业AI落地成本将陡增;若推理成本难以下降,AI Agent的商业化前景将受限。
趋势:算力成为新"数据"——掌控算力即掌控AI应用的命脉。企业AI从"试用工具"迈入"常态部署"的关键不再是模型论文发表或跑分测试,而是基础设施的可靠性与成本结构的透明化。