OpenAI巨资押晶圆级芯片，国产算力如何突围？

发布时间：2026-05-11 07:08阅读：18

OpenAI签署了一笔高达200亿美元的订单。这次并非采购英伟达GPU，而是选择了一家名为Cerebras的公司。他们所研发的芯片设计独特——整块晶圆不进行切割，直接制成一块"超级芯片"。

这与国内算力发展有何关联？影响深远。

根据科创板日报消息，OpenAI与Cerebras已签订为期三年、价值200亿美元的合作协议，采购其WSE-3晶圆级芯片。该芯片尺寸接近iPad大小，集成了4万亿个晶体管，是英伟达H100的50倍。

传统芯片生产流程是将硅晶圆分割成数百个小芯片，再分别封装测试。而Cerebras采取相反策略：整块晶圆保持完整，直接制作成超大芯片。

WSE-3的规格令人震惊：面积达46,225平方毫米，相当于iPad mini；拥有4万亿晶体管，英伟达H100仅有800亿；配备90万个AI核心，片上内存44GB；芯片内部通信带宽高达21PB/s，比GPU集群快1000倍。

通俗地说，别人是用数百个小芯片组合计算，Cerebras则是用一块大芯片独立完成所有计算。避免了芯片间通信延迟和互联瓶颈。

OpenAI为何要下注这个项目？

随着GPT-5、GPT-6模型参数规模迈向万亿级别，传统GPU集群的通信成本已成为瓶颈。晶圆级芯片理论上能够规避这一问题。

Cerebras为OpenAI提供了"第三条道路"。那么国内算力发展现状如何？我们正在走哪条路？

第一条路径：华为昇腾方案

对标英伟达，采用通用GPU架构；昇腾910B性能接近A100，生态系统通过CANN对标CUDA；优势在于自主可控，劣势在于单卡性能仍有不足。

第二条路径：寒武纪/海光方案

采用ASIC专用芯片，针对特定场景优化；推理效率高但通用性有限；适用于已定型AI应用，不适用于大模型训练。

第三条路径：超节点/集群方案

单卡性能不足就增加数量，通过互联技术弥补；华为"真武"万卡集群、曙光6万卡集群均属此类；优势是工程能力强，劣势是能耗和成本偏高。

Cerebras的晶圆级方案，本质上是以"单片集成"替代"多片互联"。这种理念，国内是否有厂商在探索？据业内人士反馈，目前公开资料中尚未发现类似方案。但这不意味着未来不会出现。

OpenAI投资Cerebras，并非预示着英伟达的终结。但这释放出一个信号：AI算力的技术路径正在发生分化。

对弱电行业意味着什么？

首先，异构计算将成为常态。

未来的智能计算中心，不会仅使用英伟达GPU，也不会只用华为昇腾。训练任务使用GPU/晶圆级芯片，推理任务使用ASIC，边缘计算使用NPU，多种架构将共存。弱电工程师需要了解各类芯片的供电、散热、网络需求，不能只会安装一种机柜。

其次，散热系统需要升级。

晶圆级芯片功耗密度极高，Cerebras WSE-3功耗超过20kW。国产万卡集群同样面临挑战，10万张卡集中运行，散热成为首要问题。液冷、浸没式冷却将从"可选项"转为"必选项"，弱电工程师需提前掌握相关技术。

再次，网络架构需要重新设计。

不同芯片厂商有各自的互联协议：英伟达的NVLink、华为的HCCS、Cerebras的SwarmX。这些协议不走标准以太网，这意味着智算中心的网络拓扑需要定制化设计。弱电集成商需要学会与芯片厂商对接，理解他们的网络需求。

技术路线的竞争，最终都会体现在基础设施层面。