AI 依赖 GPU，但这并非终局

发布时间：2026-05-19 10:45阅读：42

到了 2026 年，想买个高端显卡玩玩游戏，发现 RTX 5090 的价格直逼 3.4 万。并非显卡性能有多强悍，而是被 AI 抢占了大量显存。

这绝非玩笑。GDDR7 显存的产能，正遭受 AI 服务器对 HBM 的巨大需求挤压。三星和 SK 海力士将原本供应消费级 DRAM 的生产线转产高端 AI 芯片所需的 HBM，留给游戏显卡的显存自然捉襟见肘。英伟达和 AMD 从年初起便开始分阶段涨价，受苦的只是普通消费者。

2026 年全球 AI 基础设施投资预计超 6500 亿美元，Gartner 预测全球 AI 支出将达 2.52 万亿美元。资金投向何处？GPU。无论是大模型训练、推理还是智能体应用，哪一样不是靠 GPU 累积起来的？

科技巨头们疯狂砸钱的姿态，仿佛明天抢不到 GPU 公司就会倒闭。四大科技巨头的 AI 资本开支总和超过 6500 亿，算力即生产力，GPU 即生产资料。

2026 年最让 PC 玩家失望的消息：英伟达可能整整一年都不推出新的消费级 GeForce 显卡。这是三十年来的首次。

在 CES 2026 上，英伟达全程未提及游戏显卡，只谈 AI 平台。PCWorld 和 CNBC 都有报道，英伟达将游戏 GPU 的产能和研发资源让渡给了 AI 芯片。毕竟一张 AI 加速卡的利润抵得上几十张游戏卡，资本的选择非常现实。

结果就是：想买新卡，只能加价或者等待。RTX 5090 中国特供版自发布以来已至少涨了两千元，并非性能提升，而是显存成本上涨。况且 GDDR7 供应紧张，短期内难见缓解。

AI 的尽头是 GPU 吗？更确切地讲，GPU 仅仅是一个过渡阶段。当 GPU 的成本和功耗触及极限，行业自然会另寻出路：

专用芯片（ASIC）已蓄势待发。谷歌的 TPU 证明了专用推理芯片比通用 GPU 更高效，国内寒武纪、燧原等厂商也在跟进。推理场景对通用性要求不高，ASIC 能以更低功耗实现同等效果。

光电互联是另一条路径。CPO 和 NPO 技术可将 GPU 间通信带宽提升一个数量级，降低延迟和功耗。2026 年 GTC 和 OFC 峰会上，这两项技术是核心议题。

但这都需要时间。至少未来两三年内，GPU 仍是 AI 最硬的通货。买不到 GPU 的公司，和买不到石油的国家一样焦虑。

因此“AI 的尽头是 GPU”这句话对吗？只对了一半。GPU 是当前的瓶颈，而非终点。终点是算力廉价到像水电一样触手可及——那需要的不仅是更优秀的 GPU，而是整个计算架构的重组。