标签

OpenAI巨资押晶圆级芯片,国产算力如何突围?

发布时间:2026-05-11 07:08来源:微信阅读:6

OpenAI签署了一笔高达200亿美元的订单。这次并非采购英伟达GPU,而是选择了一家名为Cerebras的公司。他们所研发的芯片设计独特——整块晶圆不进行切割,直接制成一块"超级芯片"。

这与国内算力发展有何关联?影响深远。

根据科创板日报消息,OpenAI与Cerebras已签订为期三年、价值200亿美元的合作协议,采购其WSE-3晶圆级芯片。该芯片尺寸接近iPad大小,集成了4万亿个晶体管,是英伟达H100的50倍。

传统芯片生产流程是将硅晶圆分割成数百个小芯片,再分别封装测试。而Cerebras采取相反策略:整块晶圆保持完整,直接制作成超大芯片。

WSE-3的规格令人震惊:面积达46,225平方毫米,相当于iPad mini;拥有4万亿晶体管,英伟达H100仅有800亿;配备90万个AI核心,片上内存44GB;芯片内部通信带宽高达21PB/s,比GPU集群快1000倍。

通俗地说,别人是用数百个小芯片组合计算,Cerebras则是用一块大芯片独立完成所有计算。避免了芯片间通信延迟和互联瓶颈。

OpenAI为何要下注这个项目?

随着GPT-5、GPT-6模型参数规模迈向万亿级别,传统GPU集群的通信成本已成为瓶颈。晶圆级芯片理论上能够规避这一问题。

Cerebras为OpenAI提供了"第三条道路"。那么国内算力发展现状如何?我们正在走哪条路?

第一条路径:华为昇腾方案

对标英伟达,采用通用GPU架构;昇腾910B性能接近A100,生态系统通过CANN对标CUDA;优势在于自主可控,劣势在于单卡性能仍有不足。

第二条路径:寒武纪/海光方案

采用ASIC专用芯片,针对特定场景优化;推理效率高但通用性有限;适用于已定型AI应用,不适用于大模型训练。

第三条路径:超节点/集群方案

单卡性能不足就增加数量,通过互联技术弥补;华为"真武"万卡集群、曙光6万卡集群均属此类;优势是工程能力强,劣势是能耗和成本偏高。

Cerebras的晶圆级方案,本质上是以"单片集成"替代"多片互联"。这种理念,国内是否有厂商在探索?据业内人士反馈,目前公开资料中尚未发现类似方案。但这不意味着未来不会出现。

OpenAI投资Cerebras,并非预示着英伟达的终结。但这释放出一个信号:AI算力的技术路径正在发生分化。

对弱电行业意味着什么?

首先,异构计算将成为常态。

未来的智能计算中心,不会仅使用英伟达GPU,也不会只用华为昇腾。训练任务使用GPU/晶圆级芯片,推理任务使用ASIC,边缘计算使用NPU,多种架构将共存。弱电工程师需要了解各类芯片的供电、散热、网络需求,不能只会安装一种机柜。

其次,散热系统需要升级。

晶圆级芯片功耗密度极高,Cerebras WSE-3功耗超过20kW。国产万卡集群同样面临挑战,10万张卡集中运行,散热成为首要问题。液冷、浸没式冷却将从"可选项"转为"必选项",弱电工程师需提前掌握相关技术。

再次,网络架构需要重新设计。

不同芯片厂商有各自的互联协议:英伟达的NVLink、华为的HCCS、Cerebras的SwarmX。这些协议不走标准以太网,这意味着智算中心的网络拓扑需要定制化设计。弱电集成商需要学会与芯片厂商对接,理解他们的网络需求。

技术路线的竞争,最终都会体现在基础设施层面。