标签

Agentic AI 浪潮:存储成本霸占九成,谁掌控了 AI 命脉

发布时间:2026-06-17 09:58阅读:3

过去两年市场热议的主题是:GPU 即 AI 的全部,英伟达独占鳌头。

然而,2025 至 2026 年间,一股更隐秘却更具毁灭性的叙事正在兴起——

Agentic AI(智能体 AI)将计算模式从“单次问答”重塑为“持续运行的自主任务流”,系统的瓶颈不再取决于 FLOPS 是否充足,而是——内存带宽与容量是否足够。

结果:存储已从“沉默的组件”跃升为 AI 硬件成本中的绝对主宰。

Aletheia Capital 2026 年 6 月最新测算显示:

2025 年 AI 整机硬件中,存储综合成本(HBM + 通用 DRAM + NVMe NAND)占比约 45%

2027 年全行业存储成本中枢将突破 70%

针对大规模 Agentic AI 工作负载的 KV Cache 卸载存储机架(BF4 STX 方案),存储成本占比超过 90%——GPU 反而沦为“次要成本项”

这并非夸大其词,而是基于 BOM(物料清单)拆解得出的硬核数据。

Generative AI 时代,每次对话是无状态的——问完即弃。

Agentic AI 时代,智能体需要:

维护超长 Context Window(从 128K 扩展至百万级 Token)

执行多步工具调用链(每一步的中间结果必须持久化存储)

并行运行多个 Sub-Agent,共享记忆空间

每一步推理均需查询 KV Cache(键值缓存)——其本质是存储在 HBM/DRAM 中的巨型张量表。Context 越长、并发越高,KV Cache 越大,若重新计算,算力成本将呈指数级爆炸。

结论:若 HBM/DRAM 储备不足,推理将无法运行——并非变慢,而是直接 OOM(内存溢出)。

NVIDIA NVL72 机架的 CPU:GPU 配置,已从过去的 1:8 回调至 1:2。

原因很简单:Agentic 工作负载涉及大量调度、数据预处理及存储管理,需要海量 Server DRAM。摩根士丹利对 NVL72(VR200)的 BOM 拆解显示:内存成本在单机架中的占比从 9.36% 飙升至 25.65%,绝对成本暴涨 435%,远超 GPU 的 57% 增幅。

HBM 制造消耗的晶圆面积是同等容量普通 DRAM 的 3 倍以上(TSV 硅通孔工艺 + 多层堆叠)。当三大厂商将 80% 以上的先进产能转向 HBM,传统 DRAM 可用产能被压缩,供需缺口直接推高了全系内存价格。

TrendForce 集邦咨询已大幅上调全球存储器产值预测:

2026 年:8,893 亿美元(前值为 5,516 亿)

2027 年:超过 1.28 万亿美元,年增约 44%

成本项

金额估算

占比

趋势

GPU(裸 Die)

不含 HBM

约 396 万美元

约 43%

→ 相对稳定

HBM(高带宽内存)

约 109 万美元

约 12%→

约 20%+

⬆️ 暴涨(容量从 80GB 增至 1024GB/芯)

CPU + Server DRAM

+ NAND

约 210 万美元

约 24%

⬆️ CPU:GPU=1:2 推升 DRAM

网络

(NVLink/InfiniBand)

约 127 万美元

约 14%

持平

散热/供电/机箱

约 50 万美元

约 7%

持平

存储合计

HBM+DRAM+NAND

约 500–600 万美元

约 55–70%

⬆️ 结构性跃升

一个满配 Vera CPU 机架的 ASP 可能高达 2,600 万美元,其中片上存储(SOCAMM)单一品类占比即超 70%。

而 Google TPU V8 SuperPod 的存储硬件成本,预计将从 9,000 万增至 1.5 亿美元(2027 年)。

这组数据揭示了一个事实:AI 硬件的利润天平,已从 GPU 设计厂商向存储原厂倾斜。

企业

代码

地位

关键词

SK 海力士

KR:000660

HBM3E 当前主供

(英伟达首选)

技术领先 1–2 代,2026 年产能已售罄

美光 Micron

NASDAQ:MU

HBM4 追击 + Server

DRAM 最大纯存储玩家

Aletheia 目标价 1,600;

UBS 上调 EPS 至 155(2027)

三星半导体

KR:005930

HBM4 量产追赶中,

产能最大

良率/交货仍是短板

这三家占据全球 DRAM+HBM 份额的 95% 以上。HBM 产能 2026 年已全部售罄,新订单已排至 2027 年第一季度。卖方市场——定价权掌握在它们手中,而非英伟达。

当 HBM/DRAM 价格过高,业界正转向 KV Cache 卸载(offload)→ 分层存储架构:

热数据保留在 HBM

温数据下沉至 SCM SSD / NVMe SSD

冷数据归档至高密度 HDD

这直接利好:

三星、美光、西部数据/WDC、希捷在企业级 SSD / HDD 领域的订单激增

西部数据 2025 年以 268% 涨幅位列标普 500 榜首

环节

代表标的

逻辑

HBM/DRAM

国产化(晶圆)

长鑫/未上市→ 供应链:

深科技、太极实业

长鑫扩产拉动封测 + 设备

存储模组 + 自研主控

江波龙 (301308)、

佰维存储 (688525)、

德明利 (001309)

涨价周期第一承接者,

业绩弹性最强

存储接口芯片

(内存配套)

澜起科技、聚辰股份

SPD/TS 芯片,

DDR5 渗透率 85%(2025)刚需

利基型 DRAM

/ NOR Flash

兆易创新、北京君正、

东芯股份

三星/海力士退出利基市场留下的真空

分销 / 渠道库存重估

香农芯创、中电港

涨价周期中库存价值重估

的“隐形杠杆”

⚠️提醒:国内尚无真正意义上的 HBM 量产标的,A 股存储链的弹性更多源于涨价传导 + 国产替代份额转移,而非直接获取 HBM 超额利润。

检验项

过关标准

有没有定价权?

上游三巨头拥有;中下游模组厂赚取的是价差×周转,而非品牌溢价

需求是结构性还是周期性?

Agentic AI → KV Cache → 长上下文 → 这是结构性扩量,非库存回补

供给能否快速跟上?

HBM 需要 TSV + CoWoS 先进封装,扩产周期 18–24 个月→ 2027 年前缺口难解

最核心头寸→ 应配置 SK 海力士 / 美光(MU)这类“咽喉中的咽喉”(真正的 HBM 定价权持有者)

弹性卫星→ 国内存储模组链中拥有自研主控 + 企业级 SSD 放量的标的(涨价周期的利润弹性和持续性差异巨大)

对冲视角→ 若云厂商 CAPEX 因宏观/监管减速,存储涨价最快的部分也将最先回撤(DRAM 合约价波动性 >> HBM 长协价)

Agentic AI 出现之前,我们投资 AI = 投资算力(GPU)。

Agentic AI 之后,我们投资 AI = 投资记忆(HBM/DRAM/SSD)。

当存储占硬件成本 45% → 70%+,极端场景下超过 90%,这意味着:

AI 硬件的毛利润池,正从台积电/英伟达的生态位,重新分配给存储原厂

谁能提升 HBM 良率、扩大产能——谁就捏住了下一阶段 AI 军备竞赛的气管

国内产业链的机会不在“追逐 HBM 平替”的幻想,而在于涨价传导弹性 × 利基替代 × 企业级 SSD 渗透这三道实打实的现金流

存储不再是 GPU 的配角。在 Agentic AI 时代,GPU 才是存储的附属。

数据