AI推理赛道杀出黑马,挑战英伟达霸主地位

发布时间：2026-07-01 10:37阅读：2

就在刚刚，又一家AI芯片企业正式“出山”。

“我们即将走出隐身状态。”

美西时间6月30日，AI芯片新秀 Etched 在X平台宣布，公司已完成首颗A0流片，并建成了首批整机机柜（Frontier Inference Clusters）。

不仅如此，产品已累计签订超过10亿美元客户合同，融资总额达到8亿美元，首批产品将于今年夏季交付。

Etched还透露，早期客户测试表明，其系统在推理任务上的吞吐量、延迟和能效已处于行业领先水平。

AI芯片行业几乎每天都有新公司诞生，Etched之所以引发关注，是因为它选择了一条与英伟达截然不同的道路。

如果说英伟达希望一块GPU能够胜任训练、推理以及各类通用计算，那么Etched几乎将全部筹码都压在了AI推理（Inference）上。

公司创立于2022年，两位创始人 Gavin Uberti 和 Rob Wachen 认为，未来AI最大的瓶颈不会是训练，而是推理。

随着Agent、长上下文以及MoE模型日益普及，真正消耗算力和电力的将是每天数十亿次模型调用，而非模型训练本身。

因此，Etched没有打造一块“万能GPU”，而是围绕推理重新设计了整个系统。

这次发布的产品已不再强调单颗芯片，而是提出了一个全新概念——Frontier Inference Clusters。

根据官方描述，它不仅涵盖芯片，还包括服务器、机柜、网络、散热、软件以及制造体系，目标是整个系统层面实现更高吞吐、更低延迟、更低成本和更高能效，而非单纯追求芯片算力。

为支撑这一目标，Etched同时公布了两项核心技术。

第一是 Low-Voltage Inference（低电压推理）。官方表示，通过让计算单元运行在远低于传统AI芯片的电压下，可显著降低发热，提升持续吞吐能力。

第二是 Cluster-Scale Memory（集群级内存）。它将HBM和SRAM结合，并通过自研互联，把多个芯片的内存组织成统一的低延迟内存池，重点攻克MoE模型、长上下文以及Agent应用中的内存瓶颈。

值得注意的是，Etched已不再是一家仅有几十人的初创团队。

公司披露，目前拥有超过400名工程师，团队成员主要来自英伟达、Google TPU、Broadcom、SK Hynix等企业；已在台湾建立工厂，并在圣何塞建设了数据中心、测试中心和原型实验室，力图把设计、验证和生产全部放在同一体系内。

资本阵容同样十分豪华。

Etched累计融资8亿美元，最近一轮5亿美元融资后的估值达到50亿美元。投资方包括Peter Thiel、Jane Street、Hudson River Trading、Two Sigma、Ribbit Capital、Stripes等机构，AI领域还有Andrej Karpathy、Geoffrey Hinton、李飞飞、Arthur Mensch等人参与投资。

它会成为英伟达真正的挑战者吗？

英伟达真正的护城河并不仅是一块GPU，而是CUDA软件生态、NVLink互联、整机系统、供应链，以及多年积累的开发者生态。

Etched也意识到了这一点。因此，这家公司这次宣传的重点已经从“一颗芯片”，变成了“一整套推理基础设施”。

AI基础设施市场正在发生变化。

过去几年，大模型竞争集中在训练阶段；而随着模型趋于稳定、推理调用快速增长，越来越多资金开始流向专门优化推理成本的芯片企业。

Groq、Cerebras以及各大云厂商自研推理芯片都属于这一趋势，Etched则是最新、也是融资规模最大的参与者之一。

不管怎样，AI芯片领域有更多的竞争者总是好事，看看能否把高昂的AI成本打下来一些。

与此同时，也能看到的趋势是，AI芯片竞争已开始从“谁训练得更快”，转向“谁能让推理更便宜、更高效”，和AI的使用场景一模一样。

← 上一篇：Manifold AI流形空间获近10亿PreA轮融资下一篇：AI预适应训练：构筑心脑血管科技屏障 →