AI存储技术博弈:HBF加速落地,英伟达锁定新生态
随着生成式AI的飞速演进,算力需求呈指数级爆发,存储系统逐渐成为制约性能提升的关键瓶颈。鉴于HBM产能受限且成本高昂,行业正致力于探索下一代存储方案,HBF(高带宽闪存)与CXL(计算快速链接)逐渐成为焦点。2026年4月,行业接连传来重磅动态:SK海力士携手闪迪推动HBF标准统一,三星推出性能暴涨10倍的CXL内存系统,而英伟达则确立了短期技术策略,坚持深耕HBM并加速布局AI SSD与CXL生态,各大厂商的战略抉择正重塑AI存储的竞争版图。
HBF标准化进程提速,直指AI推理的大容量需求
今年2月,SK海力士与闪迪共同举办“HBF规格标准化联盟启动会”,正式发布面向AI推理时代的下一代存储器HBF全球标准化战略,标志着该技术正式从概念迈向产业化。作为3D NAND与高带宽堆叠技术的结晶,HBF被视为突破AI系统“内存墙”的关键,其核心亮点在于兼顾大容量与高带宽,可同时替代传统HBM显存及DDR主存。
根据联盟披露的技术路线,HBF将采用TSV(硅通孔)堆叠及BICS闪存工艺,单颗芯片容量高达4096GB,相当于当前主流HBM3E的8至16倍。这种超大规模容量特性使其极其契合对内存要求苛刻的AI推理场景,能大幅削减大型语言模型部署的硬件开销。闪迪在标准化推广中最为积极,已着手构建完整供应链,计划2026年下半年推出首款原型,量产时间提前至2027年,比原计划早了半年。
尽管HBF备受行业看好,但其普及仍面临挑战。作为一种全新架构,HBF需要芯片设计、主板布线及软件生态的配套支持,产业链成熟需时日。此外,HBF的延迟性能不及HBM,这决定了其短期内难以切入对延迟敏感的AI训练市场,主战场将锁定在大规模AI推理和边缘计算领域。
英伟达明确技术路线:短期不采用HBF,押注 HBM+AI SSD 组合
在HBF加速推进之际,作为AI芯片霸主的英伟达却传出短期内不引入HBF的消息。据Wccftech报道,英伟达仍将HBM作为核心存储方案,并计划通过高性能AI SSD和专用软件平台解决内存容量瓶颈,这一战略与其生态布局和技术路径紧密相关。
英伟达主张通过优化现有存储架构即可实现高效内存扩展,无需引入HBF。为此,其正联合铠侠、SK海力士研发支持PCIe 7.0的高性能AI SSD,并打造名为“SCADA(可扩展加速数据访问)”的软件平台。该平台创新之处在于实现GPU对SSD的直接访问,绕过传统“CPU读取SSD传给GPU”的路径,大幅降低延迟,将AI SSD随机读写性能(IOPS)目标定在100M级。此举能在不改变GPU硬件架构下,有效扩充系统可用内存,降低对HBM的依赖。
相较于英伟达的谨慎,谷歌被视为HBF的潜在主力客户。随着TPU生态扩张,下一代TPU对大容量存储需求迫切。HBF既能部分替代HBM,又能取代DDR,有助于谷歌构建低成本推理集群。谷歌的加入为HBF商业化注入强心剂,预计未来将形成英伟达主导的HBM+AI SSD路线与谷歌主导的HBF路线并存的局面。
CXL 成后 HBM 时代核心战场,三星发布 10 倍性能新系统
除HBF外,CXL作为开放互联协议,正成为存储业竞争的焦点。CXL能实现CPU与GPU、FPGA等加速器的高速互联,提供统一内存地址空间和一致性,缓解内存压力。TrendForce预测,继HBM之后,CXL将是未来3-5年增长最快的细分市场。
三星近期发布的“Pangea v2”新一代CXL内存系统展示了巨大潜力。该系统基于CXL 2.0标准,整合22组CXL模块构建统一内存池,支持多服务器接入,容量达5.5TB。实测显示,其数据传输性能较RDMA提升10.2倍,运行瓶颈减少96%。目前三星正联合Marvell和Liquid AI推进商业化,并计划2026年推出适配CXL 4.0的“Pangea v3”系统,进一步突破性能与容量极限。
除三星外,全球存储巨头均在加速CXL布局。SK海力士2022年首发CXL模块,2023年升级至2.0标准,正研发下一代产品;美光2024年首次发布CXL模块,正式入局。英伟达今年出货的Vera CPU原生支持CXL 3.1,被视为CXL规模化商用的里程碑,将极大推动生态成熟。
总体而言,当前AI存储技术正处于多元化发展的关键期。HBM仍将是未来2-3年AI训练和高端推理的主流,而HBF与CXL则分别探索后HBM时代的路径。HBF凭借超高容量瞄准2027年后的大规模推理市场,CXL则通过内存池化技术解决当前扩展难题。各大厂商基于生态优势选择不同路线,这种多元化竞争将加速AI存储创新,为下一代AI系统夯实存储基础。