AI存储新格局：HBM决定算力极限，NAND划分数据疆域

发布时间：2026-05-04 12:12阅读：28

市场对于AI内存的理解存在根本性误区——过分关注DRAM，却忽视了NAND的重要性。当前AI正经历从“算力驱动”向“内存驱动”的转变，而真正的制约因素并非通用DRAM。HBM将决定单点算力能力的上限，而NAND则划定了系统进行大规模扩展的边界。这两者协同运作才是AI存储架构的核心，那种非此即彼的观点已然过时。

市场对AI内存的判断出现了根本性偏差——过度聚焦DRAM、低估NAND。AI正从"算力驱动"转向"内存驱动"，而真正的瓶颈不在通用DRAM。HBM决定单点算力上限，NAND决定系统大规模扩展边界。两者协同才是AI存储体系的核心，非此即彼的框架已然失效。

HBM与NAND：AI存储的两道关键门槛

AI视频生成模型的资源消耗，已经清晰地划分了内存结构的不同层级。

在单次推理过程中，HBM（即GPU显存）大约需要280GB的容量，而DRAM仅需20-90GB，其主要功能是系统缓存和辅助性任务。HBM已成为AI推理的主战场，通用DRAM的角色则退居次要。

在数据中心推理环节，每个节点大约需要配置140GB的NAND，用于加载模型和支持系统运行。而在内容生产侧，情况则更为惊人——一段30秒的4K视频大约需要150-268MB的存储空间，AI视频生成的特点是会产生多个版本、具有长尾效应，并且生产量巨大。仅凭全球短视频日播放量达到1万亿次这一数据推算，即使其中仅有1%的内容由AI生成，其所需的存储空间也是天文数字。

NVIDIA推出支持150TB大容量NAND平台的单DPU，并非偶然之举，而是产业转向存储重构方向发展的明确信号。

产业发展逻辑的根本性变革

Sora、DiT等AI视频生成模型的token规模已达到400万级别，模型参数量超过500亿。当模型规模如此庞大时，计算本身不再是主要的瓶颈，数据的传输和存储反而成为了核心的矛盾点。

AI正从“计算密集型”（Compute-bound）转向“内存密集型”（Memory-bound），这一根本性的转变从底层逻辑上改变了内存的需求结构。

过去，市场普遍认为数据中心需求的增长必然会惠及DRAM，但这忽略了两个关键事实：

首先，AI推理真正消耗的是高带宽内存HBM，而非普通的DRAM；其次，AI系统的完整运行需要大量的存储支持——包括模型缓存、数据交换以及内容存储，所有这些都指向NAND。

HBM决定了算力的上限，没有足够的高带宽内存，大型模型就无法高效运行；NAND则界定了数据的边界，没有足够的存储容量，AI生成内容的规模就无法扩展。两者之间是互补关系，而非相互替代。

超级周期的三大关键观察指标

AI视频生成从离线处理转向实时生成，是引爆内存超级周期的最大变数。实时生成意味着内容供给近乎无限，交互性大幅提升，广告可以动态生成并嵌入，这将对数据量的需求产生数量级的增长。

有三个核心的观察点值得关注：

HBM产能的扩张进展。这直接决定了单个节点的算力上限。目前，HBM的产能高度集中在少数几家集成器件制造商（IDM）手中，其扩产速度是整个产业链最关键的瓶颈。

NAND企业级平台的落地速度。特别是企业级SSD和高容量DPU存储平台的普及程度。NVIDIA已经通过实际行动表明了其在该方向上的决心，关键在于产能分配的节奏。

AI视频模型的推理效率和参数规模的变化。这直接影响单位内存和存储的需求量——如果参数量持续膨胀，那么HBM和NAND将同步受益；反之，如果效率大幅提升，那么需求增量则需要重新评估。

如果以上三个因素形成合力，AI内存体系将迎来新一轮的硬件升级周期，而不仅仅是简单的周期性波动。

NAND的价值正在被重新定义

AI时代的内存竞争，并非DRAM与NAND之间的零和博弈，而是HBM与NAND的协同分工。HBM负责锁定算力的上限，而NAND则负责界定数据的边界。

当前市场在DRAM方面存在过度拥挤的共识，但却严重低估了NAND在AI存储体系中的核心地位。存储体系的重构是AI基础设施建设的下半场，这一发展趋势值得持续关注。

本文仅基于公开信息与产业逻辑进行客观分析，不构成任何投资建议，不预判股价走势，不推荐任何标的。市场有风险，投资需谨慎，所有投资决策请独立判断、自行承担风险。