标签

AI存储新格局:HBM决定算力极限,NAND划分数据疆域

发布时间:2026-05-04 12:12来源:微信阅读:6

市场对于AI内存的理解存在根本性误区——过分关注DRAM,却忽视了NAND的重要性。当前AI正经历从“算力驱动”向“内存驱动”的转变,而真正的制约因素并非通用DRAM。HBM将决定单点算力能力的上限,而NAND则划定了系统进行大规模扩展的边界。这两者协同运作才是AI存储架构的核心,那种非此即彼的观点已然过时。

市场对AI内存的判断出现了根本性偏差——过度聚焦DRAM、低估NAND。AI正从"算力驱动"转向"内存驱动",而真正的瓶颈不在通用DRAM。HBM决定单点算力上限,NAND决定系统大规模扩展边界。两者协同才是AI存储体系的核心,非此即彼的框架已然失效。

HBM与NAND:AI存储的两道关键门槛

HBM与NAND:AI存储的两道关键门槛

AI视频生成模型的资源消耗,已经清晰地划分了内存结构的不同层级。

在单次推理过程中,HBM(即GPU显存)大约需要280GB的容量,而DRAM仅需20-90GB,其主要功能是系统缓存和辅助性任务。HBM已成为AI推理的主战场,通用DRAM的角色则退居次要。

在数据中心推理环节,每个节点大约需要配置140GB的NAND,用于加载模型和支持系统运行。而在内容生产侧,情况则更为惊人——一段30秒的4K视频大约需要150-268MB的存储空间,AI视频生成的特点是会产生多个版本、具有长尾效应,并且生产量巨大。仅凭全球短视频日播放量达到1万亿次这一数据推算,即使其中仅有1%的内容由AI生成,其所需的存储空间也是天文数字。

NVIDIA推出支持150TB大容量NAND平台的单DPU,并非偶然之举,而是产业转向存储重构方向发展的明确信号。

产业发展逻辑的根本性变革

产业发展逻辑的根本性变革

Sora、DiT等AI视频生成模型的token规模已达到400万级别,模型参数量超过500亿。当模型规模如此庞大时,计算本身不再是主要的瓶颈,数据的传输和存储反而成为了核心的矛盾点。

AI正从“计算密集型”(Compute-bound)转向“内存密集型”(Memory-bound),这一根本性的转变从底层逻辑上改变了内存的需求结构。

过去,市场普遍认为数据中心需求的增长必然会惠及DRAM,但这忽略了两个关键事实:

首先,AI推理真正消耗的是高带宽内存HBM,而非普通的DRAM;其次,AI系统的完整运行需要大量的存储支持——包括模型缓存、数据交换以及内容存储,所有这些都指向NAND。

HBM决定了算力的上限,没有足够的高带宽内存,大型模型就无法高效运行;NAND则界定了数据的边界,没有足够的存储容量,AI生成内容的规模就无法扩展。两者之间是互补关系,而非相互替代。

超级周期的三大关键观察指标

超级周期的三大关键观察指标

AI视频生成从离线处理转向实时生成,是引爆内存超级周期的最大变数。实时生成意味着内容供给近乎无限,交互性大幅提升,广告可以动态生成并嵌入,这将对数据量的需求产生数量级的增长。

有三个核心的观察点值得关注:

HBM产能的扩张进展。 这直接决定了单个节点的算力上限。目前,HBM的产能高度集中在少数几家集成器件制造商(IDM)手中,其扩产速度是整个产业链最关键的瓶颈。

NAND企业级平台的落地速度。 特别是企业级SSD和高容量DPU存储平台的普及程度。NVIDIA已经通过实际行动表明了其在该方向上的决心,关键在于产能分配的节奏。

AI视频模型的推理效率和参数规模的变化。 这直接影响单位内存和存储的需求量——如果参数量持续膨胀,那么HBM和NAND将同步受益;反之,如果效率大幅提升,那么需求增量则需要重新评估。

如果以上三个因素形成合力,AI内存体系将迎来新一轮的硬件升级周期,而不仅仅是简单的周期性波动。

NAND的价值正在被重新定义

NAND的价值正在被重新定义

AI时代的内存竞争,并非DRAM与NAND之间的零和博弈,而是HBM与NAND的协同分工。HBM负责锁定算力的上限,而NAND则负责界定数据的边界。

当前市场在DRAM方面存在过度拥挤的共识,但却严重低估了NAND在AI存储体系中的核心地位。存储体系的重构是AI基础设施建设的下半场,这一发展趋势值得持续关注。

本文仅基于公开信息与产业逻辑进行客观分析,不构成任何投资建议,不预判股价走势,不推荐任何标的。市场有风险,投资需谨慎,所有投资决策请独立判断、自行承担风险。

关注「鑫观点」看更多深度分析

关注「鑫观点」看更多深度分析