标签

AI CPU:性能跃迁新纪元

伴随大模型迈向Agentic AI(多智能体推理)的新范式,CPU在数据中心中的定位正经历根本性转变——从以往的任务调度与数据流转,升级为深度介入推理环节,致使CPU需求激增,甚至显现出用量超越GPU的态势。在Agentic AI推理流程中,约70%-80%的时间由CPU承担(涵盖任务分解、沙箱隔离、线程调度及应用调用等),GPU则仅聚焦于核心计算。这使得CPU与GPU的配比由传统的1:2逐步向1:1乃至更高比例演进,单颗CPU需支撑的线程数量剧增,以英伟达Vera(88核176线程)为例,单颗CPU可承

2026-05-31 19:04:10  |  9 阅读

HBM需求爆发:AI算力时代的内存技术革命

在AI大模型时代,GPU的性能天花板完全取决于HBM(高带宽内存),HBM的容量与带宽必须代代实现翻倍增长,不再像传统内存那样存在周期性瓶颈,需求将呈现持续指数级攀升。 一、回顾:CPU时代,内存(DDR)并不关键 在电脑、手机等传统CPU算力时代,行业的唯一核心目标是让CPU的运算速度不断提升。 我们日常接触的DDR普通内存仅仅是辅助角色,在行业中的地位极低,十余年来技术几乎没有重大突破,主要原因有两方面: 1、CPU自带优化机制,无需内存加速 CPU配备了多层缓存和并行计算架构,能够自行弥补内存速度慢

2026-05-18 12:39:38  |  6 阅读

为何 AI 始终面临存储荒

AI 堪称“数据饕餮”与“带宽黑洞”,其存储需求呈指数级暴涨,而产能与物理极限却难以企及。以下分五点详述:一、模型规模激增,直接撑爆内存- 大模型参数从数十亿跃升至数千亿,未来更将达万亿级。- 训练阶段,全量参数需载入 HBM 或高速 DRAM 方可运行。- 推理阶段,需储备海量 KV 缓存(上下文状态),上下文越长、并发用户越多,内存消耗越巨。- 结论:模型越庞大,内存越捉襟见肘;并发越高,短缺越严峻。二、训练数据:只进不出,无限累积- 训练涵盖全网文本、影像、视频、日志及对话,均需永久留存。- 全球数

2026-05-14 21:12:50  |  10 阅读

AMD数据中心业务持续爆发式增长

AMD掌门人苏姿丰透露,该公司数据中心业务正持续迅猛扩张,已成为推动营收与利润增长的核心引擎。“伴随客户从试验阶段迈向规模化投产,我们在推理市场观察到强劲的发展动能,其中领先的内存容量与带宽是我们的核心竞争优势,”苏姿丰在分析师电话会中指出。她称,基于此,AMD(355.26, 13.72, 4.02%)在数据中心领域正深化与客户的长期战略合作,涵盖跨代际的大规模部署。“我们对2027年实现数据中心AI业务年收入达数百亿美元抱有坚定且持续增强的信心,并将在未来几年突破80%以上的长期增长目标,”她表示。

2026-05-06 06:39:19  |  6 阅读