算力市场定价逻辑生变

发布时间：2026-06-26 20:03阅读：2

根据纽约市场研究机构Ornn的统计数据，英伟达B200的GPU时租费用在5月30日触及6.11美元/时的季度峰值后持续下滑，截至6月21日已降至4.22美元/时，三周内跌幅约30%。

从表象分析，B200租赁价格回落似乎只是周期性调整。但高盛交易台负责人Rich Privorotsky更为直接地指出：当资源稀缺性延续时，价格理应维持高位，大规模资本投入才有合理性；而一旦供给扩大且价格不断下行，「算力紧张」这一整套定价基础将被撼动。

这番话的指向很清晰：若下游用户的租赁成本在下降，而英伟达的芯片售价并未调整，中间环节的利润空间就会遭受压缩，最终可能表现为订单增速放缓。

AI推理基础设施服务商Baseten CEO向媒体透露，英伟达B200千卡级GPU集群采购订单的交付周期已延至2027年，等待时间长达12至15个月。由此可知，短期内现货宽松与长期交付紧张并存的现象，使得市场预期开始出现分歧。

中游的信号比上游更为一致。国内外互联网巨头纷纷收缩战线，Token从「无限畅饮」转向「定量供应」。

腾讯6月将员工月度Token配额从2000美元（约1.35万元人民币）下调至1500元人民币，并取消全员普惠机制，改为部门统筹、按需调配。内部表述很直白：AI应用的唯一衡量标准不是算力消耗量，而是业务效率提升与价值创造。

海外大厂同步收紧。Uber为员工设置每月1500美元Token上限；亚马逊暂停内部Token排行榜，制止「为用AI而用AI」的刷量式KPI；微软削减大部分第三方Claude Code授权，强制改用自研Copilot；Meta上线AI使用监控体系，限制无效算力消耗。

麦肯锡2025年全球AI调研数据更为严峻：全球仅39%的企业通过AI实现正向利润回报，超过六成企业长期处于「只烧钱、无回报」的困境。行业正从「以Token消耗量论高下」全面转向「以商业价值论成败」。