AI推理赛道杀出黑马,挑战英伟达霸主地位
就在刚刚,又一家AI芯片企业正式“出山”。
“我们即将走出隐身状态。”
美西时间6月30日,AI芯片新秀 Etched 在X平台宣布,公司已完成首颗A0流片,并建成了首批整机机柜(Frontier Inference Clusters)。
不仅如此,产品已累计签订超过10亿美元客户合同,融资总额达到8亿美元,首批产品将于今年夏季交付。
Etched还透露,早期客户测试表明,其系统在推理任务上的吞吐量、延迟和能效已处于行业领先水平。
AI芯片行业几乎每天都有新公司诞生,Etched之所以引发关注,是因为它选择了一条与英伟达截然不同的道路。
如果说英伟达希望一块GPU能够胜任训练、推理以及各类通用计算,那么Etched几乎将全部筹码都压在了AI推理(Inference)上。
公司创立于2022年,两位创始人 Gavin Uberti 和 Rob Wachen 认为,未来AI最大的瓶颈不会是训练,而是推理。
随着Agent、长上下文以及MoE模型日益普及,真正消耗算力和电力的将是每天数十亿次模型调用,而非模型训练本身。
因此,Etched没有打造一块“万能GPU”,而是围绕推理重新设计了整个系统。
这次发布的产品已不再强调单颗芯片,而是提出了一个全新概念——Frontier Inference Clusters。
根据官方描述,它不仅涵盖芯片,还包括服务器、机柜、网络、散热、软件以及制造体系,目标是整个系统层面实现更高吞吐、更低延迟、更低成本和更高能效,而非单纯追求芯片算力。
为支撑这一目标,Etched同时公布了两项核心技术。
第一是 Low-Voltage Inference(低电压推理)。官方表示,通过让计算单元运行在远低于传统AI芯片的电压下,可显著降低发热,提升持续吞吐能力。
第二是 Cluster-Scale Memory(集群级内存)。它将HBM和SRAM结合,并通过自研互联,把多个芯片的内存组织成统一的低延迟内存池,重点攻克MoE模型、长上下文以及Agent应用中的内存瓶颈。
值得注意的是,Etched已不再是一家仅有几十人的初创团队。
公司披露,目前拥有超过400名工程师,团队成员主要来自英伟达、Google TPU、Broadcom、SK Hynix等企业;已在台湾建立工厂,并在圣何塞建设了数据中心、测试中心和原型实验室,力图把设计、验证和生产全部放在同一体系内。
资本阵容同样十分豪华。
Etched累计融资8亿美元,最近一轮5亿美元融资后的估值达到50亿美元。投资方包括Peter Thiel、Jane Street、Hudson River Trading、Two Sigma、Ribbit Capital、Stripes等机构,AI领域还有Andrej Karpathy、Geoffrey Hinton、李飞飞、Arthur Mensch等人参与投资。
它会成为英伟达真正的挑战者吗?
英伟达真正的护城河并不仅是一块GPU,而是CUDA软件生态、NVLink互联、整机系统、供应链,以及多年积累的开发者生态。
Etched也意识到了这一点。因此,这家公司这次宣传的重点已经从“一颗芯片”,变成了“一整套推理基础设施”。
AI基础设施市场正在发生变化。
过去几年,大模型竞争集中在训练阶段;而随着模型趋于稳定、推理调用快速增长,越来越多资金开始流向专门优化推理成本的芯片企业。
Groq、Cerebras以及各大云厂商自研推理芯片都属于这一趋势,Etched则是最新、也是融资规模最大的参与者之一。
不管怎样,AI芯片领域有更多的竞争者总是好事,看看能否把高昂的AI成本打下来一些。
与此同时,也能看到的趋势是,AI芯片竞争已开始从“谁训练得更快”,转向“谁能让推理更便宜、更高效”,和AI的使用场景一模一样。