标签

端侧AI崛起,破解存储墙难题迫在眉睫

发布时间:2026-04-25 10:42来源:微信阅读:4

随着AI技术从云端向边缘及终端设备渗透,一场以“端侧AI”(Edge AI)为核心的技术革新正在兴起。

在此背景下,我们需要思考数十亿终端设备的未来走向——特别是如何打破它们必须依赖云端才能处理AI任务的现状。这些设备应进化为具备自主AI能力的系统,能高效执行本地推理,其性能指标通常以每瓦特运算次数(TOPS/W)来体现。

相较于AI数据中心,端侧实时推理更强调在数据源头(即设备端)就近加速。然而,这也带来了算力限制、内存性能及严格能耗成本控制的难题。这表明,在打造高效端侧AI方案时,计算与内存资源已变得同等关键。

值得注意的是,存储芯片正从单纯的数据“仓库”转变为具有“计算功能”的核心——不仅是被动存储参数,更是端侧AI推理的“大脑”与“动力源”。面对冯·诺依曼架构中的“内存墙”与“功耗墙”,业界正探索两条路径:一是提升传统存储性能或开发新型存储介质;二是采用存算一体架构,实现计算与存储的深度结合。

本文将深入探讨这一变革,从存储硬件及架构演进角度,分析产业如何应对端侧AI的机遇与挑战,并展望存算一体等前沿技术的未来。

“存储墙”:端侧AI难以逾越的障碍

端侧AI是指将AI模型的推理或训练直接在物理世界的终端设备上执行,无需上传云端。这些设备包括智能手机、智能摄像头、自动驾驶汽车、工业物联网网关、可穿戴设备及家用电器等(图1)。

图1:端侧AI应用场景示意图。(