128TB内存!这家初创公司如何破解AI服务器的内存墙困局
点击蓝字 关注我们SUBSCRIBEto USMajestic Labs内存瓶颈是当前大语言模型(LLM)发展面临的最严峻挑战。权威研究表明,大模型输出文本属于典型的内存密集型任务,模型生成速度受制于内存读取带宽,且随着参数规模扩大而愈发严重,这种内存墙问题严重制约着大模型推理效率(https://arxiv.org/pdf/2403.14123)。AI硬件初创公司Majestic Labs祭出一套系统性解决方案,自主研发名为Prometheus的AI服务器,单机最大支持128TB内存,是英伟达旗舰AI平
黄仁勋力挺SK海力士:见证其市值破万亿倍感欣慰
IT之家 6 月 2 日消息,据韩媒 The Elec 今晚报道,英伟达掌门人黄仁勋对 SK 海力士的高速发展给予高度评价,并再次强调双方的深度合作。黄仁勋同时透露,英伟达期待与韩国人工智能和机器人领域展开更全面合作。 谈及英伟达如何筛选高带宽内存(HBM)供应商时,黄仁勋指出,性能、品质、稳定性及供货能力都是核心考量。“HBM 看起来平平无奇,实际上却极其精密。我们与 SK 合作相当深入,建立了长期伙伴关系,我为 SK 所取得的成就感到骄傲。SK 海力士近期市值突破 1 万亿美元(IT之家注:现汇率约合
AI芯片产业链深度解析:算力、存储、传输三大领域26家龙头企业全面梳理
随着GPT-5参数量迈入万亿级别,人形机器人单台算力需求达到100TOPS,全国智算中心以每月新增10个的速度快速扩张,全球科技产业面临的核心挑战已经非常明确:飞速增长的算力需求与芯片供给能力之间的巨大差距。摩根士丹利最新研究报告显示,2026年全球AI算力需求同比增速将突破400%,而实际算力供给增速仅为128%,供需缺口接近46%。如果把AI比作一个智慧生命体: ✅ 算力芯片=AI的大脑,承担计算与思考功能,决定大模型训练推理的效率上限 ✅ 存储芯片=AI的数据仓库,负责海量数据存储管理,HBM内存价
HBM需求爆发:AI算力时代的内存技术革命
在AI大模型时代,GPU的性能天花板完全取决于HBM(高带宽内存),HBM的容量与带宽必须代代实现翻倍增长,不再像传统内存那样存在周期性瓶颈,需求将呈现持续指数级攀升。 一、回顾:CPU时代,内存(DDR)并不关键 在电脑、手机等传统CPU算力时代,行业的唯一核心目标是让CPU的运算速度不断提升。 我们日常接触的DDR普通内存仅仅是辅助角色,在行业中的地位极低,十余年来技术几乎没有重大突破,主要原因有两方面: 1、CPU自带优化机制,无需内存加速 CPU配备了多层缓存和并行计算架构,能够自行弥补内存速度慢
从亏损到暴富:海力士的逆袭与半导体轮回
来源:首席经济学家论坛 陈李系东吴证券(8.420, 0.16, 1.94%)全球首席经济学家、东吴香港行政总裁,中国首席经济学家论坛理事 人均610万奖金的传闻 近期,一则消息在国内社交平台引发热议。一家韩国芯片企业,拥有3.5万名员工,据传人均奖金将高达610万人民币。 这家企业正是SK海力士。 关于这个数字需要做个说明:610万是国际投行麦格理基于2027年盈利预测推算得出——若海力士2027年营业利润达到447万亿韩元,按劳资协议规定的"营业利润10%用于员工分红"计算,人均约12.9亿韩元,折合
美国算力瓶颈:AI芯片荒重塑战略棋局
一、美国AI扩张受芯片掣肘(一)需求激增远超供给预期报告显示,至2026年,AI芯片制造已成为阻碍AI算力建设速度的核心瓶颈。无论是模型训练、部署还是优化,都极度依赖算力资源,且需求呈指数级攀升,远超厂商预判。简言之,算力即依托芯片与数据中心支撑模型迭代的基础。自2022年底ChatGPT问世,微软、亚马逊、谷歌、Meta及甲骨文计划在2026年斥资近7000亿美元用于AI基建,其中大头便是芯片。报告强调,2024至2025年,美国AI扩容的最大制约曾是电力,但到了2026年,芯片本身成为新瓶颈。Open
AI时代存储的估值难题
AI时代的存储困局:手里握着战略物资,却始终躲不过周期性的估值安排。英伟达自称算力王者,依托CUDA生态搭出难以撼动的行业屏障,H100、B200芯片也被视作投身AI赛道的“入场券”;存储三巨头(三星、海力士、美光)轻描淡写回应:我们的市盈率只有5倍。微软把自己摆在AI应用裁决者的位置上,Copilot产品渗透率加速攀升,握着OpenAI关键技术的优势,更是在三轮技术更迭中始终站稳行业高地;存储三巨头:我们的市盈率只有5倍。谷歌凭借全栈技术底盘位居前列,自研TPU性能遥遥领先,Gemini模型正在重塑全球
利好利空消息盘点:聚焦股市关键动态(2026年5月7日)
宏观新闻 1、外交部发言人林剑于5月6日主持例行记者会。针对记者提问的美国总统特朗普相关涉华言论,林剑回应称,中美双方围绕特朗普总统访华事宜持续保持沟通。 2、中共中央政治局委员、外交部长王毅在北京会见伊朗外长阿拉格齐。双方就当前关切议题展开讨论。阿拉格齐通报了伊美谈判的最新进展,并介绍伊方后续考虑,指出事实已表明,政治危机不能依靠军事方式解决;伊方将坚定维护国家主权与民族尊严,并通过和平谈判持续凝聚共识,争取实现全面、长期的解决路径。当前也可加快推进霍尔木兹海峡的开放问题。王毅表示,中方愿贯彻习近平主席
AI浪潮助推存储芯片大涨
5月4日亚太股市走势强劲,表现最抢眼的当属存储芯片板块。韩国股市SK海力士股价刷新历史纪录,市值突破千万亿大关;美股存储板块前一晚表现强劲,美光和闪迪涨幅均超8%,从而引领了整个亚太科技股的上涨。存储芯片板块之所以突然飙升,根本动力在于AI需求的井喷,如今它已跃升为AI产业不可或缺的核心部件。过去存储芯片多用于手机和电脑,而今随着AI服务器的大量部署,其内存需求量是普通服务器的8至10倍。特别是高端的HBM内存和DDR5,已成为各大AI厂商争相抢购的稀缺资源。以谷歌和微软为例,今年它们投入数千亿资金建设A
250331AI算力基建概念速览
六、重构算力版图全球首个星座级太空AI算力实现常态化运行【太空AI算力】9月25日,国星宇航的太空计算星座依托第四届琶洲算法大赛完成商业化验证,意味着全球首个星座级太空AI算力服务已在中国进入日常运营阶段。该“星算”计划今年已形成首批阶段性成果:今年5月已完成12颗计算卫星发射并成功入轨,单颗卫星最高算力可达744TOPS。完成组网后,整体具备5POPS的处理能力,可让80亿参数级天基模型持续稳定运行。比赛中的“星上路网分析”任务里,卫星在轨完成图像采集、模型推理并将结果回传,端到端响应时延被压缩到3分钟
每日AI硬件动态速递(20260502):国产显卡进军全球,OpenAI算力战略调整,光互连技术悄然变革
微软WHQL认证是通向全球市场的通行证:砺算成为中国首家、同时也是全球第四家获得此项认证的GPU厂商,这表明其显卡与Windows系统达到了官方的兼容级别,能够直接进入全球消费级市场,从而打破英伟达、AMD和英特尔的市场垄断格局。真正意义上的自主研发,无IP授权依赖:其产品基于自研的TrueGPU天图架构,从核心设计到指令集均为自主掌握。产线已就绪,并非空谈:官方发布的视频展示了完整的6纳米工艺产线流程(包括制造、测试与封装环节),第一季度已完成小规模试产,产品将于5月20日开售并直接现货供应,其定价相比
2026年AI芯片终局:Token经济取代算力,HBM成新核心
如果把这次AI浪潮拆解开来,你会发现一个正在发生的根本性转变:衡量价值的核心,不再仅仅是GPU的算力本身,而是“单位成本能产出多少Token”。本文试图解答市场长期困惑的一个问题——为何每一代GPU对HBM的需求几乎注定呈指数级增长?更重要的是,为何这种增长不会像过去那样中途停顿?这也是我长期看多三星和SK海力士的理论依据(凭借此观点,近一个月本人美股收益率达78%)。一、被忽视的第一性原理在当前架构下,AI推理的本质可简化为一句话:Token吞吐量 ≈ HBM容量 × HBM带宽这并非经验之谈,而是基于
AI算力加速 内存股迎再估值:美光闪迪或大幅上调
AI算力的扩张正在重塑半导体产业的盈利格局,内存厂商因此成为最直接的受益对象。Melius Research分析师本·赖茨斯(Ben Reitzes)认为,随着AI应用不断扩展,内存需求的强度很可能长期保持在高位,并带动行业商业模式出现调整。他表示,和软件赛道相比,芯片企业通常能获得更强的估值支撑。尤其是美光科技(MU.O)与闪迪(SNDK.O)等公司,当前已进入价值重估区间,且此前首次被给予“买入”评级。在赖茨斯看来,传统软件依靠席位收费的SaaS模式正承受更大压力。随着客户把预算更多投入AI基础设施,