芯片初创瞄准AI内存瓶颈突破路径
超大规模的人工智能模型让服务器负荷剧增,高端芯片也更容易出现闲置。谷歌以及元宇宙领域(Meta)的多位资深从业者表示,他们已经摸索出可行的破解思路。
内容摘要
Majestic Labs AI 打造了新一代服务器系统“普罗米修斯”,核心目标是在运行超大 AI 模型时,打破由内存容量与带宽带来的性能瓶颈。
由谷歌(Alphabet 旗下)与 Meta 过往关键高管组成的团队,研发了一套新的服务器架构,意在应对当前 AI 模型规模持续膨胀、技术复杂度不断上升所带来的部署与运行难题。
Majestic Labs AI 由奥弗・沙查姆、真澄・莱德斯与沙・拉比伊联合创立。公司在去年 11 月公布完成 1 亿美元融资,投资方包括波威夫资本、勒克斯资本、格罗夫资本等机构。三位创始人曾在谷歌任职,参与设计并研发首代数据中心与移动端芯片;随后加入 Meta 现实实验室,带头组建定制芯片研发力量。
这家初创公司位于加州洛斯阿尔托斯一处较为简约的办公楼内,所在位置也属于常见的商业街区。目前团队自研的新芯片被认为有望对抗“内存墙”——这种在算力层面愈发普遍的约束,正显著影响 AI 模型的响应速度。
Majestic 将自研服务器系统命名为普罗米修斯(Prometheus),计划在其中部署数百颗自研 AIU(人工智能处理单元)芯片。创始人称,相关方案的内存容量可达到英伟达等竞品 GPU 的 1000 倍,更贴合承载数万亿参数级超大型 AI 模型的运行需求。
拉比伊表示,受内存限制,现阶段即便依托高端芯片的强劲算力,许多顶级大模型在商业化落地上也越来越难以具备现实可行性。由于模型运行需要在芯片间调取额外内存,计算资源常常长时间等待,进而出现算力空转与资源浪费。
为解决这一问题,Majestic 的新款单台服务器可扩展至 128TB 高速内存,能够支持更大规模 AI 模型的顺畅运行,覆盖 5 万亿至 10 万亿参数区间,同时内存规格也可按客户需求进行定制。
公司首席执行官沙查姆常驻特拉维夫。在视频采访中他提到:“这是业界首款以内存为核心设计的 AI 处理器,专为超大型模型所需的海量内存规格而打造。”
随着智能体 AI 的应用迅速普及,各类自主 AI 机器人在代码编写等场景中被大量采用,进一步加剧了全球企业算力资源紧张。高端芯片租赁价格随之上扬,部分 AI 服务不得不出现停机限流,甚至被迫降低用户使用频次。
在此背景下,对高算力、低功耗且能快速完成推理任务的芯片需求持续走高,也为 Majestic 等数十家软硬件初创企业创造了更明确的发展机遇。
科技巨头同样加快布局。超威半导体(AMD(334.63, 6.20, 1.81%))方面加大对新一代芯片推理适配能力的宣传;去年年末,英伟达斥资 200 亿美元收购芯片企业 Groq,并吸纳其核心管理团队,近期又发布了针对推理场景打造的自研芯片服务器。
上周,谷歌云官宣新一代 TPU 张量处理器,采用训练芯片与推理芯片双芯片架构设计,并重点加强高带宽内存配置。另一推理芯片新锐企业 Cerebras 今年与亚马逊(261.12, -2.87, -1.09%)云达成重要合作,同时在 4 月初递交 IPO 上市申请。
Majestic 的创始人认为,当前市场上的推理方案难以满足未来超巨型 AI 模型对海量内存的需求。拉比伊用“需要一个车库却被迫买下整栋房子”来形容这种局面:企业不得不超额采购冗余算力,只为换取足够的内存。
企业接下来仍面临一项关键挑战:服务器所需的内存芯片供给持续紧缺,多数厂商预计短缺状况至少延续到明年。为此,Majestic 选择全面采用通用 DRAM 来缓解供应链压力;相较于高带宽内存(HBM),通用 DRAM 的落地更容易、成本更低。而 HBM 因涉及多层芯片三维堆叠的复杂工艺,生产周期更长且产能更受限制。
创始人透露,公司主要技术壁垒在于自研互联架构:在低功耗条件下实现处理器与百 TB 级海量内存的高速互联,数据传输速度可超越传统 HBM 的表现。
Majestic 已锁定多家合作客户,预计自 2027 年起逐步落地合作,对应潜在营收规模达数亿美元;由于相关协议仍处于保密阶段,目前尚未披露客户名称。
责任编辑:郭明煜
新浪财经声明:此消息系转载自合作媒体,新浪财经登载此文出于传递更多信息之目的,文章内容仅供参考,不构成投资建议。
郑重声明:1.根据《证券法》规定,禁止编造、传播虚假信息或者误导性信息,扰乱证券市场;2.用户在本社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。
