标签

128TB内存!这家初创公司如何破解AI服务器的内存墙困局

点击蓝字 关注我们SUBSCRIBEto USMajestic Labs内存瓶颈是当前大语言模型(LLM)发展面临的最严峻挑战。权威研究表明,大模型输出文本属于典型的内存密集型任务,模型生成速度受制于内存读取带宽,且随着参数规模扩大而愈发严重,这种内存墙问题严重制约着大模型推理效率(https://arxiv.org/pdf/2403.14123)。AI硬件初创公司Majestic Labs祭出一套系统性解决方案,自主研发名为Prometheus的AI服务器,单机最大支持128TB内存,是英伟达旗舰AI平

2026-06-04 15:12:49  |  0 阅读

AI泡沫将以何种方式终结

当你打开2026年任何一家科技企业的战略蓝图、银行的季度研判,抑或是当日的财经要闻,一个愈发诡异的画面扑面而来:所有参与者都在围绕“算力”这一基础设施重新描绘世界蓝图。企业不再谈论业务扩张,银行不再谈论资产健康,媒体不再谈论技术飞跃——整个时代似乎被一种关于“能量与存储”的AI新叙事所裹挟。AI基础设施的时间线、产能投入、折旧摊销是否合理?归根结底,不过是基于金融估值需求的推演罢了。业界不再谈论应用落地,也不再谈论算法迭代,反而集体蜕变成一群“萨满式的能量崇拜者”。即便你隐约感知AI存在泡沫,却说不清究竟

2026-05-31 08:09:21  |  5 阅读

内存互联芯片解析:六图揭秘 AI 服务器高速通道

本星球半导体研究员「存芯早察」,全面解析了内存连接芯片的技术机理、核心器件、竞争态势及市场潜力。通过六张图表,清晰呈现这条“AI 服务器隐秘赛道”的全貌。随着大模型参数激增,算力虽已提升,但数据供给却跟不上,这就是所谓的“内存墙”。CXL 协议正逐步突破此瓶颈,实现 CPU、内存与加速器之间的高速互联。借助这六张图,你将一次性掌握:CXL 的工作原理、功能及其在 AI 领域的价值RDIMM 与 MRDIMM 的芯片结构剖析CXL 新增器件(Retimer/Switch/MXC)及其链路架构2026 年最新

2026-05-28 18:22:05  |  5 阅读

AI 科普专栏 | 《eMRAM 存储芯片革命》第五期:深度解析寒序科技为何领跑国内 8nm eMRAM AI 芯片

导读2026 年 5 月 7 日,一则消息在半导体与 AI 领域引发轰动:中国寒序科技携手韩国 SEMIFIVE,成功实现亚洲首例 8nm eMRAM 边缘 AI 芯片流片。许多人不禁发问:寒序科技究竟是谁?为何它能率先推出 8nm eMRAM AI 芯片?其技术实力究竟有多雄厚?本期第五篇,我们将对此进行全方位深度剖析。核心团队:融资历程(截至 2026 年 5 月):寒序科技是国内唯一具备从物理、材料、器件到异质集成、芯片设计、算法全链条研发能力的磁计算企业。技术分工(创新合作模式):核心性能指标:量

2026-05-19 18:35:16  |  4 阅读

AI硬件热潮退去,软件优化成新战场

全球AI整体支出2026年预计突破2.52万亿美元,其中AI基础设施支出预计达1.366万亿美元。Meta、谷歌、微软、亚马逊四家科技巨头,2026年计划投入约7250亿美元用于AI资本开支,较2025年的4100亿美元增长77%。OpenAI计算资源投入预计达数百亿美元级别,较2017年增长数十倍至百倍。但这串令人眩晕的数字背后,藏着一个让整个行业尴尬的事实——据Cast AI《2026年Kubernetes优化现状报告》对数千家企业的实测数据,生产环境中GPU集群平均利用率仅5%。花了几万亿买的显卡,

2026-05-14 10:04:19  |  15 阅读

AI推理新王现身:整片晶圆造芯,OpenAI豪掷200亿,英伟达受冲击?

昨夜观看了《荒野心智观察》B站视频,内容极具价值,但技术细节较为密集。现将重点梳理如下:大家好。AI领域近日传来重磅消息:一家名为Cerebras的芯片企业,几乎已晋升为OpenAI的“专属”推理芯片供应商。OpenAI不仅向其抛出200亿美元的大单,其高管团队更亲自注资,实现深度捆绑。你或许会疑惑:英伟达的GPU不是所向披靡吗?OpenAI为何要“另辟蹊径”?答案仅四个字:AI推理。今日,我们用通俗语言,剖析这场正在上演的“算力博弈”。---一、AI下半场:从“死记硬背”转向“现场作答”AI能力可分为两

2026-05-11 22:32:39  |  5 阅读
芯片初创瞄准AI内存瓶颈突破路径

芯片初创瞄准AI内存瓶颈突破路径

超大规模的人工智能模型让服务器负荷剧增,高端芯片也更容易出现闲置。谷歌以及元宇宙领域(Meta)的多位资深从业者表示,他们已经摸索出可行的破解思路。 内容摘要 Majestic Labs AI 打造了新一代服务器系统“普罗米修斯”,核心目标是在运行超大 AI 模型时,打破由内存容量与带宽带来的性能瓶颈。 由谷歌(Alphabet 旗下)与 Meta 过往关键高管组成的团队,研发了一套新的服务器架构,意在应对当前 AI 模型规模持续膨胀、技术复杂度不断上升所带来的部署与运行难题。 Majestic Labs

2026-04-28 20:53:54  |  4 阅读