标签

AI 表面是软件,实则是硬件博弈

发布时间:2026-06-27 00:09阅读:2

很多人以为,AI 是最轻的生意。

没有门店,没有库存,没有厂房。 用户看到的只是一个输入框:问一句,答一段。

它不像造车,要有生产线。 不像炼钢,要有高炉。 不像电商,要有仓库和物流。

AI 看起来更像一种漂浮在云端的软件能力。

但最近几条新闻放在一起看,会发现一个变化:

OpenAI 与 Broadcom 的自研推理芯片 Jalapeño 相关报道,说明模型公司开始向推理芯片和全栈基础设施策略下沉。

Qualcomm 与 Meta 的数据中心 CPU / 下一代服务器平台相关合作,说明 AI 算力竞争正在从单一 GPU,扩展到整台服务器架构。

Micron 与 Anthropic 围绕 AI 基础设施达成战略合作,则提醒我们:AI 不只是要算得快,还要喂得上、存得住、调得动。

这三条新闻不是简单的硬件快讯。

它们共同指向一件事:

我们平时使用 AI,感知很简单。

打开一个网页,输入一句话,几秒钟后得到一段回答。 如果回答不错,我们会觉得这个模型很聪明。 如果回答很慢,我们会觉得这个产品体验不好。 如果额度不够,我们会觉得平台收费太贵。

但这些前台体验,背后都有一套真实成本。

你让 AI 总结一份长文档,文档要被读取、切分、送进模型,再生成回答。

你让 AI 写代码、做表格、分析会议纪要,背后都不是屏幕里“想一想”就结束。它需要算力执行推理,需要服务器调度资源,需要内存搬运数据,需要存储不断读写,还需要数据中心持续供电。

普通用户看到的是一句回答。 平台看到的是一次调用。

当调用次数少的时候,这些成本可以藏在幕后。 但当 AI 变成每天被大量用户使用的基础服务时,这些成本就藏不住了。

真正的问题也会从:

变成:

这就是 AI 和很多普通软件不太一样的地方。

普通软件可以越做越轻,复制成本越来越低。 但 AI 的每一次调用,都要消耗真实算力。

用户越多,任务越复杂,AI 背后的那座工厂就越重。

就像一家餐厅刚开业时,大家只关心菜好不好吃。 可当它每天要服务几万人时,真正考验的就不只是厨师手艺,而是厨房动线、备货、供应链、出餐速度和后厨系统。

AI 也是一样。

刚开始,大家看的是模型聪不聪明。 往后,大家会越来越关心:

这也是为什么,做模型和软件的公司,会越来越关心芯片。

OpenAI 与 Broadcom 的自研推理芯片 Jalapeño 相关报道,重点不在某个芯片参数,而在它释放出的信号:

大模型早期,竞争焦点更多在训练。

谁能训练出更强的模型,谁能在能力上领先,谁能让模型回答得更好,这是第一阶段。

但模型一旦进入大规模应用,长期成本就会转向推理。

用户每问一次,系统就要推理一次。 企业每调用一次 API,平台就要承担一次计算。 AI 助手每天处理邮件、客服、代码、文档、会议纪要,背后都是一笔笔持续发生的推理账单。

训练像建厂。 推理像每天生产。

建厂很贵,但真正长期考验运营能力的,是这座工厂每天能不能稳定、便宜、高效地生产。

如果模型公司完全依赖外部通用算力,就会遇到三个问题。

第一,成本很难完全掌控。 用户量越大,推理越多,账单越重。

第二,供应不一定总是稳定。 高端芯片、服务器资源、云算力,并不是永远随取随用。

第三,效率未必最适合自己。 通用硬件适合很多场景,但模型公司如果围绕自己的推理需求做优化,就可能在长期成本上获得更大空间。

所以,模型公司开始向芯片层下沉,并不奇怪。

这不是说 OpenAI 已经摆脱 Nvidia,也不是说 GPU 不重要了,更不是说 Jalapeño 已经全面替代外部算力。

更准确的理解是:

当调用规模足够大,推理成本就不再只是采购问题,而会变成战略问题。

过去看一家 AI 公司,我们首先看它的模型、产品和应用。 以后可能还要看:

它有没有稳定算力