标签

算力市场定价逻辑生变

发布时间:2026-06-26 20:03阅读:2

根据纽约市场研究机构Ornn的统计数据,英伟达B200的GPU时租费用在5月30日触及6.11美元/时的季度峰值后持续下滑,截至6月21日已降至4.22美元/时,三周内跌幅约30%。

从表象分析,B200租赁价格回落似乎只是周期性调整。但高盛交易台负责人Rich Privorotsky更为直接地指出:当资源稀缺性延续时,价格理应维持高位,大规模资本投入才有合理性;而一旦供给扩大且价格不断下行,「算力紧张」这一整套定价基础将被撼动。

这番话的指向很清晰:若下游用户的租赁成本在下降,而英伟达的芯片售价并未调整,中间环节的利润空间就会遭受压缩,最终可能表现为订单增速放缓。

AI推理基础设施服务商Baseten CEO向媒体透露,英伟达B200千卡级GPU集群采购订单的交付周期已延至2027年,等待时间长达12至15个月。由此可知,短期内现货宽松与长期交付紧张并存的现象,使得市场预期开始出现分歧。

中游的信号比上游更为一致。国内外互联网巨头纷纷收缩战线,Token从「无限畅饮」转向「定量供应」。

腾讯6月将员工月度Token配额从2000美元(约1.35万元人民币)下调至1500元人民币,并取消全员普惠机制,改为部门统筹、按需调配。内部表述很直白:AI应用的唯一衡量标准不是算力消耗量,而是业务效率提升与价值创造。

海外大厂同步收紧。Uber为员工设置每月1500美元Token上限;亚马逊暂停内部Token排行榜,制止「为用AI而用AI」的刷量式KPI;微软削减大部分第三方Claude Code授权,强制改用自研Copilot;Meta上线AI使用监控体系,限制无效算力消耗。

麦肯锡2025年全球AI调研数据更为严峻:全球仅39%的企业通过AI实现正向利润回报,超过六成企业长期处于「只烧钱、无回报」的困境。行业正从「以Token消耗量论高下」全面转向「以商业价值论成败」。