标签

AI推理驱动SSD需求激增

发布时间:2026-03-31 15:01来源:微信阅读:7

随着全球AI产业从"建模"转向"应用",数据中心内部正在进行一场存储架构的变革。铠侠(KIOXIA)在CFMS | MemoryS 2026峰会上展示了2025年至2031年间数据中心NAND位需求将以每年34%的速度增长,其中AI推理需求增长最快,达到56%,超越AI训练(11%)和传统应用(14%)。

铠侠SSD首席技术执行官福田浩一表示:"AI推理已经从大量模型训练转变为使用推理模型。谁能够提供最经济、最快、最安全的推理AI,谁就能在竞争中获胜,而存储成为关键瓶颈。"

铠侠SSD首席技术执行官福田浩一

面对AI需求变化,铠侠提出SSD技术演进的四个重点方向:高性能高容量方案支持KV Cache扩展、符合NVIDIA Storage-Next标准的超高IOPS方案、超大容量QLC方案,以及替代HDD的归档存储方案。

HBM到SSD:KV Cache推动新存储层级

福田浩一强调:"随着问题数量增加,推理数据需求呈指数级增长。"KV Cache通过缓存中间计算结果来加速推理,但传统HBM和DRAM难以应对日益增长的上下文长度。因此,需要引入Context Memory Storage(上下文存储)作为新的存储层级。

为此,铠侠推出了CM9系列CMX版企业级SSD,采用E3.S形态,容量达25.6TB,支持3 DWPD的混合使用耐久度,兼顾高性能、高容量与寿命。其"G3.5层"设计连接高速以太网和Smart NIC,实现KV Cache数据高效管理。

铠侠高管解释说:"长上下文KV Cache将进一步增加SSD需求,原先存储在HBM或DRAM的数据需转移到硬盘,以节省GPU资源并减少能源浪费。"CM9系列CMX版将在第三季度上市,为大规模推理环境提供存储支持。

BiCS FLASH Gen 9/10双轨发展

铠侠采用"双轴发展战略",同时推进第九代和第十代BiCS FLASH。第十代采用CBA技术,实现332层堆叠,提升bit密度和接口速度,适用于高性能应用;第九代结合现有单元技术与CMOS技术,平衡性能与成本。

铠侠表示:"针对不同应用,我们会采用不同技术,包括CMOS和功率技术,以满足客户需求。"此外,铠侠将在今年推出UFS 5.0产品,解决手机AI的存储带宽瓶颈。

AiSAQ:突破DRAM限制的向量检索

KV Cache解决推理中间数据存储问题,而AiSAQ技术则应对RAG场景下的大规模向量数据库难题。AiSAQ通过"近零DRAM架构",将数据结构保存在SSD上,结合NVIDIA cuVS库加速索引构建。

数据显示,AiSAQ在处理1024维向量时,索引构建速度提升20.4倍,端到端数据摄取时间加速7.8倍。该技术已应用于48亿参数规模的向量检索,并正向100亿参数迈进。

铠侠表示:"AiSAQ不仅提高AI准确性,还扩大SSD在生成式AI中的应用,推动从"计算为中心"转向"存储为中心"。"

QLC扩展:从冷存储到温数据

铠侠推动QLC SSD从冷存储扩展到温数据场景。LC9系列QLC NVMe企业级SSD,采用E3.L形态时容量可达245.76TB,通过FDP技术降低写放大因子,延长SSD寿命。

铠侠高管表示:"QLC SSD正填补TLC SSD与近线HDD之间的空白。利用FDP技术,QLC SSD在数据中心中的使用将进一步增加。"LC9系列已在企业级和消费级市场推出。

供需平衡:AI驱动的新常态

面对企业级存储市场的供需紧张,铠侠保持乐观态度。高管表示:"AI需求增加使供需形势紧张,预计未来需求不会急剧下降。"铠侠采取双轴发展战略,平衡高性能计算与成本诉求。

福田浩一总结说:"铠侠将持续推进闪存边界,释放更多可能性。"在AI驱动的存储革命中,如何平衡性能、容量与成本,将是未来数据中心架构的关键。

THE END

关注“电子工程专辑”加小编微信

现已开放地区群,请发送消息【深圳】【上海】【北京】【成都】【西安】到公众号