内存带宽_标签-酷阅新闻

AI算力：异构芯片的混战格局

类别核心障碍资金流向对HBM的依赖度Training（训练）全面需求算力+带宽+互联全拉满极高Prefill（读题）计算能力算力核心中等Decode（答题）内存带宽HBM带宽或SRAM高推荐/检索容量+随机访问超大容量内存（CXL/DRAM）低MoE路由/Agent通信交换互联带宽+极低时延低模型规模INT4量化后大小能否放进44GB？7B3.5 GB轻松70B35 GB勉强（KV Cache空间极小）405B（Dense）200 GB完全放不下671B（MoE，激活37B）~18 GB放得下CoreWe

2026-07-11 05:17:15 | 23 阅读

跳过M6高端线直接上M7，苹果在AI领域下了一盘大棋

苹果在自研芯片迭代策略上出现了重大转向。根据彭博社披露的最新规划显示，苹果将打破自M1时代沿用至今的渐进式升级模式，彻底放弃M6 Pro与M6 Max的开发工作。在今年推出M6标准版之后，所有研发资源将直接转向针对端侧AI优化的M7高端系列。这是Apple Silicon发展史上首次出现的战略级断代。这次调整力度相当激进。核心驱动因素在于端侧AI的演进速度远超预期。传统的挤牙膏式架构迭代已无法支撑未来的算力需求。今年发布的基础版M6将内存带宽提升至200GB/s，但这仅仅是权宜之计。苹果显然判断不应在M6

2026-06-27 01:13:22 | 14 阅读

Agentic AI 浪潮：存储成本霸占九成，谁掌控了 AI 命脉

过去两年市场热议的主题是：GPU 即 AI 的全部，英伟达独占鳌头。然而，2025 至 2026 年间，一股更隐秘却更具毁灭性的叙事正在兴起——Agentic AI（智能体 AI）将计算模式从“单次问答”重塑为“持续运行的自主任务流”，系统的瓶颈不再取决于 FLOPS 是否充足，而是——内存带宽与容量是否足够。结果：存储已从“沉默的组件”跃升为 AI 硬件成本中的绝对主宰。Aletheia Capital 2026 年 6 月最新测算显示：2025 年 AI 整机硬件中，存储综合成本（HBM + 通用 D

2026-06-17 09:58:07 | 23 阅读

AI CPU：性能跃迁新纪元

伴随大模型迈向Agentic AI（多智能体推理）的新范式，CPU在数据中心中的定位正经历根本性转变——从以往的任务调度与数据流转，升级为深度介入推理环节，致使CPU需求激增，甚至显现出用量超越GPU的态势。在Agentic AI推理流程中，约70%-80%的时间由CPU承担（涵盖任务分解、沙箱隔离、线程调度及应用调用等），GPU则仅聚焦于核心计算。这使得CPU与GPU的配比由传统的1:2逐步向1:1乃至更高比例演进，单颗CPU需支撑的线程数量剧增，以英伟达Vera（88核176线程）为例，单颗CPU可承

2026-05-31 19:04:10 | 25 阅读

HBM需求爆发：AI算力时代的内存技术革命

在AI大模型时代，GPU的性能天花板完全取决于HBM（高带宽内存），HBM的容量与带宽必须代代实现翻倍增长，不再像传统内存那样存在周期性瓶颈，需求将呈现持续指数级攀升。一、回顾：CPU时代，内存（DDR）并不关键在电脑、手机等传统CPU算力时代，行业的唯一核心目标是让CPU的运算速度不断提升。我们日常接触的DDR普通内存仅仅是辅助角色，在行业中的地位极低，十余年来技术几乎没有重大突破，主要原因有两方面： 1、CPU自带优化机制，无需内存加速 CPU配备了多层缓存和并行计算架构，能够自行弥补内存速度慢

2026-05-18 12:39:38 | 26 阅读

为何 AI 始终面临存储荒

AI 堪称“数据饕餮”与“带宽黑洞”，其存储需求呈指数级暴涨，而产能与物理极限却难以企及。以下分五点详述：一、模型规模激增，直接撑爆内存- 大模型参数从数十亿跃升至数千亿，未来更将达万亿级。- 训练阶段，全量参数需载入 HBM 或高速 DRAM 方可运行。- 推理阶段，需储备海量 KV 缓存（上下文状态），上下文越长、并发用户越多，内存消耗越巨。- 结论：模型越庞大，内存越捉襟见肘；并发越高，短缺越严峻。二、训练数据：只进不出，无限累积- 训练涵盖全网文本、影像、视频、日志及对话，均需永久留存。- 全球数

2026-05-14 21:12:50 | 56 阅读

AMD数据中心业务持续爆发式增长

AMD掌门人苏姿丰透露，该公司数据中心业务正持续迅猛扩张，已成为推动营收与利润增长的核心引擎。“伴随客户从试验阶段迈向规模化投产，我们在推理市场观察到强劲的发展动能，其中领先的内存容量与带宽是我们的核心竞争优势，”苏姿丰在分析师电话会中指出。她称，基于此，AMD（355.26, 13.72, 4.02%）在数据中心领域正深化与客户的长期战略合作，涵盖跨代际的大规模部署。“我们对2027年实现数据中心AI业务年收入达数百亿美元抱有坚定且持续增强的信心，并将在未来几年突破80%以上的长期增长目标，”她表示。

2026-05-06 06:39:19 | 14 阅读