Agentic AI 浪潮:存储成本霸占九成,谁掌控了 AI 命脉
过去两年市场热议的主题是:GPU 即 AI 的全部,英伟达独占鳌头。
然而,2025 至 2026 年间,一股更隐秘却更具毁灭性的叙事正在兴起——
Agentic AI(智能体 AI)将计算模式从“单次问答”重塑为“持续运行的自主任务流”,系统的瓶颈不再取决于 FLOPS 是否充足,而是——内存带宽与容量是否足够。
结果:存储已从“沉默的组件”跃升为 AI 硬件成本中的绝对主宰。
Aletheia Capital 2026 年 6 月最新测算显示:
2025 年 AI 整机硬件中,存储综合成本(HBM + 通用 DRAM + NVMe NAND)占比约 45%
2027 年全行业存储成本中枢将突破 70%
针对大规模 Agentic AI 工作负载的 KV Cache 卸载存储机架(BF4 STX 方案),存储成本占比超过 90%——GPU 反而沦为“次要成本项”
这并非夸大其词,而是基于 BOM(物料清单)拆解得出的硬核数据。
Generative AI 时代,每次对话是无状态的——问完即弃。
Agentic AI 时代,智能体需要:
维护超长 Context Window(从 128K 扩展至百万级 Token)
执行多步工具调用链(每一步的中间结果必须持久化存储)
并行运行多个 Sub-Agent,共享记忆空间
每一步推理均需查询 KV Cache(键值缓存)——其本质是存储在 HBM/DRAM 中的巨型张量表。Context 越长、并发越高,KV Cache 越大,若重新计算,算力成本将呈指数级爆炸。
结论:若 HBM/DRAM 储备不足,推理将无法运行——并非变慢,而是直接 OOM(内存溢出)。
NVIDIA NVL72 机架的 CPU:GPU 配置,已从过去的 1:8 回调至 1:2。
原因很简单:Agentic 工作负载涉及大量调度、数据预处理及存储管理,需要海量 Server DRAM。摩根士丹利对 NVL72(VR200)的 BOM 拆解显示:内存成本在单机架中的占比从 9.36% 飙升至 25.65%,绝对成本暴涨 435%,远超 GPU 的 57% 增幅。
HBM 制造消耗的晶圆面积是同等容量普通 DRAM 的 3 倍以上(TSV 硅通孔工艺 + 多层堆叠)。当三大厂商将 80% 以上的先进产能转向 HBM,传统 DRAM 可用产能被压缩,供需缺口直接推高了全系内存价格。
TrendForce 集邦咨询已大幅上调全球存储器产值预测:
2026 年:8,893 亿美元(前值为 5,516 亿)
2027 年:超过 1.28 万亿美元,年增约 44%
成本项
金额估算
占比
趋势
GPU(裸 Die)
不含 HBM
约 396 万美元
约 43%
→ 相对稳定
HBM(高带宽内存)
约 109 万美元
约 12%→
约 20%+
⬆️ 暴涨(容量从 80GB 增至 1024GB/芯)
CPU + Server DRAM
+ NAND
约 210 万美元
约 24%
⬆️ CPU:GPU=1:2 推升 DRAM
网络
(NVLink/InfiniBand)
约 127 万美元
约 14%
持平
散热/供电/机箱
约 50 万美元
约 7%
持平
存储合计
HBM+DRAM+NAND
约 500–600 万美元
约 55–70%
⬆️ 结构性跃升
一个满配 Vera CPU 机架的 ASP 可能高达 2,600 万美元,其中片上存储(SOCAMM)单一品类占比即超 70%。
而 Google TPU V8 SuperPod 的存储硬件成本,预计将从 9,000 万增至 1.5 亿美元(2027 年)。
这组数据揭示了一个事实:AI 硬件的利润天平,已从 GPU 设计厂商向存储原厂倾斜。
企业
代码
地位
关键词
SK 海力士
KR:000660
HBM3E 当前主供
(英伟达首选)
技术领先 1–2 代,2026 年产能已售罄
美光 Micron
NASDAQ:MU
HBM4 追击 + Server
DRAM 最大纯存储玩家
Aletheia 目标价 1,600;
UBS 上调 EPS 至 155(2027)
三星半导体
KR:005930
HBM4 量产追赶中,
产能最大
良率/交货仍是短板
这三家占据全球 DRAM+HBM 份额的 95% 以上。HBM 产能 2026 年已全部售罄,新订单已排至 2027 年第一季度。卖方市场——定价权掌握在它们手中,而非英伟达。
当 HBM/DRAM 价格过高,业界正转向 KV Cache 卸载(offload)→ 分层存储架构:
热数据保留在 HBM
温数据下沉至 SCM SSD / NVMe SSD
冷数据归档至高密度 HDD
这直接利好:
三星、美光、西部数据/WDC、希捷在企业级 SSD / HDD 领域的订单激增
西部数据 2025 年以 268% 涨幅位列标普 500 榜首
环节
代表标的
逻辑
HBM/DRAM
国产化(晶圆)
长鑫/未上市→ 供应链:
深科技、太极实业
长鑫扩产拉动封测 + 设备
存储模组 + 自研主控
江波龙 (301308)、
佰维存储 (688525)、
德明利 (001309)
涨价周期第一承接者,
业绩弹性最强
存储接口芯片
(内存配套)
澜起科技、聚辰股份
SPD/TS 芯片,
DDR5 渗透率 85%(2025)刚需
利基型 DRAM
/ NOR Flash
兆易创新、北京君正、
东芯股份
三星/海力士退出利基市场留下的真空
分销 / 渠道库存重估
香农芯创、中电港
涨价周期中库存价值重估
的“隐形杠杆”
⚠️提醒:国内尚无真正意义上的 HBM 量产标的,A 股存储链的弹性更多源于涨价传导 + 国产替代份额转移,而非直接获取 HBM 超额利润。
检验项
过关标准
有没有定价权?
上游三巨头拥有;中下游模组厂赚取的是价差×周转,而非品牌溢价
需求是结构性还是周期性?
Agentic AI → KV Cache → 长上下文 → 这是结构性扩量,非库存回补
供给能否快速跟上?
HBM 需要 TSV + CoWoS 先进封装,扩产周期 18–24 个月→ 2027 年前缺口难解
最核心头寸→ 应配置 SK 海力士 / 美光(MU)这类“咽喉中的咽喉”(真正的 HBM 定价权持有者)
弹性卫星→ 国内存储模组链中拥有自研主控 + 企业级 SSD 放量的标的(涨价周期的利润弹性和持续性差异巨大)
对冲视角→ 若云厂商 CAPEX 因宏观/监管减速,存储涨价最快的部分也将最先回撤(DRAM 合约价波动性 >> HBM 长协价)
Agentic AI 出现之前,我们投资 AI = 投资算力(GPU)。
Agentic AI 之后,我们投资 AI = 投资记忆(HBM/DRAM/SSD)。
当存储占硬件成本 45% → 70%+,极端场景下超过 90%,这意味着:
AI 硬件的毛利润池,正从台积电/英伟达的生态位,重新分配给存储原厂
谁能提升 HBM 良率、扩大产能——谁就捏住了下一阶段 AI 军备竞赛的气管
国内产业链的机会不在“追逐 HBM 平替”的幻想,而在于涨价传导弹性 × 利基替代 × 企业级 SSD 渗透这三道实打实的现金流
存储不再是 GPU 的配角。在 Agentic AI 时代,GPU 才是存储的附属。
数据