AI推理驱动SSD需求激增

发布时间：2026-03-31 15:01阅读：15

随着全球AI产业从"建模"转向"应用"，数据中心内部正在进行一场存储架构的变革。铠侠（KIOXIA）在CFMS | MemoryS 2026峰会上展示了2025年至2031年间数据中心NAND位需求将以每年34%的速度增长，其中AI推理需求增长最快，达到56%，超越AI训练（11%）和传统应用（14%）。

铠侠SSD首席技术执行官福田浩一表示："AI推理已经从大量模型训练转变为使用推理模型。谁能够提供最经济、最快、最安全的推理AI，谁就能在竞争中获胜，而存储成为关键瓶颈。"

铠侠SSD首席技术执行官福田浩一

面对AI需求变化，铠侠提出SSD技术演进的四个重点方向：高性能高容量方案支持KV Cache扩展、符合NVIDIA Storage-Next标准的超高IOPS方案、超大容量QLC方案，以及替代HDD的归档存储方案。

HBM到SSD：KV Cache推动新存储层级

福田浩一强调："随着问题数量增加，推理数据需求呈指数级增长。"KV Cache通过缓存中间计算结果来加速推理，但传统HBM和DRAM难以应对日益增长的上下文长度。因此，需要引入Context Memory Storage（上下文存储）作为新的存储层级。

为此，铠侠推出了CM9系列CMX版企业级SSD，采用E3.S形态，容量达25.6TB，支持3 DWPD的混合使用耐久度，兼顾高性能、高容量与寿命。其"G3.5层"设计连接高速以太网和Smart NIC，实现KV Cache数据高效管理。

铠侠高管解释说："长上下文KV Cache将进一步增加SSD需求，原先存储在HBM或DRAM的数据需转移到硬盘，以节省GPU资源并减少能源浪费。"CM9系列CMX版将在第三季度上市，为大规模推理环境提供存储支持。

BiCS FLASH Gen 9/10双轨发展

铠侠采用"双轴发展战略"，同时推进第九代和第十代BiCS FLASH。第十代采用CBA技术，实现332层堆叠，提升bit密度和接口速度，适用于高性能应用；第九代结合现有单元技术与CMOS技术，平衡性能与成本。

铠侠表示："针对不同应用，我们会采用不同技术，包括CMOS和功率技术，以满足客户需求。"此外，铠侠将在今年推出UFS 5.0产品，解决手机AI的存储带宽瓶颈。

AiSAQ：突破DRAM限制的向量检索

KV Cache解决推理中间数据存储问题，而AiSAQ技术则应对RAG场景下的大规模向量数据库难题。AiSAQ通过"近零DRAM架构"，将数据结构保存在SSD上，结合NVIDIA cuVS库加速索引构建。

数据显示，AiSAQ在处理1024维向量时，索引构建速度提升20.4倍，端到端数据摄取时间加速7.8倍。该技术已应用于48亿参数规模的向量检索，并正向100亿参数迈进。

铠侠表示："AiSAQ不仅提高AI准确性，还扩大SSD在生成式AI中的应用，推动从"计算为中心"转向"存储为中心"。"

QLC扩展：从冷存储到温数据

铠侠推动QLC SSD从冷存储扩展到温数据场景。LC9系列QLC NVMe企业级SSD，采用E3.L形态时容量可达245.76TB，通过FDP技术降低写放大因子，延长SSD寿命。

铠侠高管表示："QLC SSD正填补TLC SSD与近线HDD之间的空白。利用FDP技术，QLC SSD在数据中心中的使用将进一步增加。"LC9系列已在企业级和消费级市场推出。

供需平衡：AI驱动的新常态

面对企业级存储市场的供需紧张，铠侠保持乐观态度。高管表示："AI需求增加使供需形势紧张，预计未来需求不会急剧下降。"铠侠采取双轴发展战略，平衡高性能计算与成本诉求。

福田浩一总结说："铠侠将持续推进闪存边界，释放更多可能性。"在AI驱动的存储革命中，如何平衡性能、容量与成本，将是未来数据中心架构的关键。

THE END

关注“电子工程专辑”加小编微信

现已开放地区群，请发送消息【深圳】【上海】【北京】【成都】【西安】到公众号

← 上一篇：华南企业加速AI布局数据治理成关键瓶颈下一篇：AI智能体崛起：2026年职场新纪元 →