存储产业全面拥抱AI时代
AI驱动的存储价格飙升,也在3月27日深圳举办的CFMS|MemoryS 2026展会上显露无遗:参会人数较上年激增一倍,会场所在酒店人潮涌动,连前台服务人员都频频向访客打听:“存储还要紧缺多久?”——他们正盘算着拆解旧电脑内存条来应急。
伴随存储“超级周期”来临,行业焦点已由“谁能抢到货”“谁库存更厚”,转向“如何高效盘活存量应对周期波动”,以及直击AI核心瓶颈。存储产业正于新一轮竞争中加速重构,技术突破力与场景适配力,已成为企业穿越周期的关键能力。
从“数据仓库”跃升为AI演进“动力中枢”
随着生成式AI由训练阶段大规模迈入推理落地阶段,存储产业正经历一场本质性范式迁移:昔日仅承担数据“仓库”职能的存储设备,如今已升级为左右AI生产效能的“动力中枢”,其战略地位被推至历史高点。
WSTS预测,2026年全球半导体市场规模将达9750亿美元,同比增长26.3%,距万亿美元仅咫尺之遥;其中,存储领域投资规模远超其他芯片类别。深圳市闪存市场资讯有限公司总经理邰炜指出:“我们判断2026年全球存储市场将突破6000亿美元,体量数倍于过往峰值。AI服务器占整体服务器出货比重将超20%;单台AI训练服务器所需SSD容量已逾256GB,推理服务器则达70~100GB,相较2023年提升2.5~3倍。”他强调,此轮爆发的核心动因,在于AI推理对存储提出结构性新需求:传统数据量公式为“用户数×设备数×精度×时长”,而AI时代演变为“大模型数量×参数量×多模态×再训练频次×终端数”,海量模型持续产出的多模态参数,催生出远超预期的存储空间压力。(当前存储行情如何?哪些规格最抢手?一线专家深度解析)
AI催生存储需求井喷
该需求跃迁直接引发存储产业结构性变革。长江存储科技有限责任公司固态硬盘事业部负责人谭弘表示:“存力在GPU时代,已非简单‘储油罐’,而是决定效率的‘炼油厂’。”目前GPU集群实际可用率仅约50%,症结正在于存储带宽受限——海量模型参数与上下文需经狭窄“存储通道”传输,致使算力长期闲置。(长江存储谭弘:AI时代,存力即“炼油厂”)
存力瓶颈制约算力释放
三星电子执行副总裁兼方案平台开发团队负责人张实完进一步指出,AI正从“生成式AI”迈向“物理AI(Physical AI)”新阶段。后者高度依赖高帧率视频、3D点云等连续时序数据的实时吞吐,“高性能存储已非加分项,而是系统决策速度与扩展能力的根本底座。”
物理AI催生数据新范式
市场数据印证趋势:Fgi预计2024~2029年企业级SSD复合年增长率达34.9%;摩根大通测算,2024~2027年AI服务器专用企业级SSD复合年增速将高达71%。
联芸科技董事长方小玲补充道,AI应用重心由训练转向推理,存储角色发生根本转变:训练阶段,存储是算力的“后方仓库”;推理阶段,则升格为算力的“前端加速器”。传统架构以大文件顺序读写为优化目标,而AI推理中,小文件随机读写占比超60%,且对延迟稳定性极为敏感——KV Cache高频调用、模型参数动态加载等场景,均要求存储系统具备微秒级响应与百万IOPS并发能力。
训练与推理阶段的存储定位之变
在大模型多模态深化、智能体规模化落地的浪潮下,存储的性能指标、架构设计与生态体系迎来全域重塑,全球存储产业链正协同发力,抢占AI时代新制高点。
多维突破直击AI存储痛点
针对AI推理带来的随机读写压力、长上下文缓存需求、多模态数据洪流等关键挑战,全球存储厂商正从接口协议、硬件形态到软件算法展开全栈创新,构建分层解决方案,彻底解除存储对AI发展的制约。
接口协议代际跃迁成为性能跃升主引擎。PCIe 6.0已步入量产阶段,PCIe 7.0研发同步提速。Cadence亚太区IP与生态系统销售群资深总监陈慧新介绍,PCIe作为主机与加速器、网卡、NVMe SSD间的关键互连技术,正通过PAM4信号与轻量前向纠错实现突破:PCIe 6.0单通道速率达64GT/s;PCIe 7.0更将翻倍至128GT/s,为AI存储提供充沛带宽。三星展出的PCIe 6.0 SSD PM1763,在25W功耗约束下实现2倍性能提升与1.5倍能效跃升;长江存储发布的PCIe Gen5企业级eSSD PE522,顺序读取达14GB/s,随机读取达3400K IOPS,写入延迟低至5μs,有力支撑AI推理实时响应。
存储分层架构重构成为效率跃升关键路径。为应对长上下文推理中KV Cache的指数级增长,业界普遍采用“内存+SSD”双层缓存策略。铠侠SSD首席技术执行官福田浩一指出,SSD正聚焦四大方向:KV Cache扩容、NVIDIA Storage-Next兼容、高密度QLC方案、HDD替代。为此,铠侠推出CM9系列CMX版企业级SSD,单盘容量达25.6TB,混合耐久度3 DWPD,成为大规模推理场景优选。
近期Agent应用爆发式增长,引发Token消耗激增、数据交互频次呈指数上升,温热数据比例显著提高。兼具高密度与低成本优势的QLC NAND,正成为承载海量AI数据的主流介质;但其固有短板——耐久性偏低、随机写入性能不足,亦成为规模化落地的主要障碍。
平头哥半导体在存储架构创新上展现差异化实力,其ZNS+QLC融合方案成为平衡AI存储成本与性能的关键破局点。平头哥半导体产品总监周冠锋在演讲中表示,ZNS(分区命名空间)技术通过精细化数据写入管理,可大幅降低写放大、减少垃圾回收频次,从而显著延长QLC SSD寿命并增强性能稳定性,有效破解QLC耐用性差与性能不可控两大行业难题。周冠锋强调:“平头哥镇岳510企业级SSD主控芯片,联合上层存储系统,依托‘原生设计、接口统一、软硬协同、软件定义’四大支柱,成功打通QLC介质从理论优势到大规模商用的‘最后一公里’,标志着企业级存储正式迈入高性能、大容量、低成本的新纪元。”
QLC成AI存储主流趋势
端云协同与软硬一体成为场景落地核心支撑。英特尔中国区技术部总经理高宇指出,在AI技术迅猛演进背景下,智能体凭借复杂任务分解、工具调度与结果生成能力,正成为市场焦点,广泛渗透办公、数据分析等场景。但其规模化部署亦暴露三大瓶颈:高算力与Token消耗、云端限流、隐私安全风险——动辄数千万乃至上亿的月度Token支出抬高使用门槛,云端流量拥塞影响体验,数据上传更带来敏感信息泄露隐患。在此背景下,英特尔提出“云+端”混合部署路径,成为推动智能体在AIPC落地的关键解法。
面向智能体的四类部署范式
英特尔梳理出四种部署模式:纯云端部署存在成本与隐私短板;纯本地部署则难以满足大模型长窗口推理对终端算力的严苛要求;而“协同协作”(接力式)与“云+端双主力模型智能决策”两类混合模式,则是专为AIPC定制的科学路径。“协同协作”以云端模型为主力,按端侧算力与AI能力智能分发子任务,既节省云端资源与Token,又保障隐私数据本地处理;“双主力模型”则在端侧部署轻量决策系统,结合上下文动态判定任务流向,灵活调度云端强大算力与端侧基础算力,实现资源最优配置。
坚持“存储即核心”的江波龙,则聚焦“集成式存储赋能端侧AI”。江波龙董事长、总经理蔡华波认为,当前AI虽短期推高存储价格,但云端AI基建加速成熟,也将强力反哺端侧AI百花齐放。江波龙致力于打造“存储产品的Foundry模式”,整合工程、工艺、技术等综合能力,精准响应大容量、高速率、低延迟、小尺寸乃至定制化端侧AI存储需求。
构建端侧AI专属存储Foundry体系
全场景智能存储生态构建,绝非单点突破可及,亟需芯片设计、存储制造、终端应用、软件算法等全链条深度协同。
终端应用企业牵引场景真实落地。小鹏汽车嵌入式平台高级总监段志飞表示,车载存储需求已从单一容量导向,升级为匹配车型定位与算力方案的梯度化定义,亟需存储厂商前置参与平台定义与量产适配。阿里云千问大模型高级产品解决方案架构师李彬指出,大模型由文本交互迈向全模态交互,对存储容量、吞吐、延迟提出更高标准,需与存储厂商联合优化数据链路。江波龙联合AMD、紫光展锐,依托存储智能体与HLC技术,实现大模型本地高效部署,验证了终端与存储协同创新价值。
软件算法企业释放生态深层潜力。腾讯操作系统内核资深技术专家曾敬翔分享,通过UMRD自适应画像、MGLRU冷热识别等算法革新,重构Linux SWAP分配器,显著提升服务器内存利用率,为云存储生态提供软件级优化路径。Solidigm推出的Luceta AI软件套件,借助生成式AI实现质检自动化,构建“硬件+软件”一体化交付方案。
产业链协同是生态构筑的底层支点。英特尔在魔搭社区上线AI PC专区,开放AI开发工具、参考代码与技能库,覆盖热搜摘要、OCR、语音识别等核心能力,并举办开发者大赛激发共创活力;长江存储已由颗粒供应商跃升为全栈方案商,形成“芯片—模组—固件—生态”闭环能力,在供应链端与伙伴紧密协作,保障产能稳定;铠侠携手NVIDIA、VMware等头部厂商深度适配,确保产品无缝兼容主流AI平台,加速场景商用。平头哥亦积极共建生态,其镇岳510主控芯片已完成与多家模组厂商适配,覆盖企业级SSD至消费级存储全品类,为产业链提供灵活可靠的底层芯片支持。
从芯片设计到终端落地,从硬件迭代到软件优化,全场景智能存储生态的构建离不开各环节深度耦合。AI时代的存储生态,既需要上游芯片企业的底层突破、中游设备厂商的方案创新、下游应用企业的场景反馈,更呼唤全产业链的开放共治。存储企业应携手伙伴,以技术共研、资源共享、标准共建为纽带,合力推进千行百业数字化转型,筑牢数字经济发展根基。