标签

云服务商收紧GPU资源分配 AI初创企业面临算力困境

发布时间:2026-04-24 21:45来源:新浪新闻阅读:7

由于微软及其他云计算服务提供商将GPU资源优先供给内部团队与大型企业客户,人工智能领域的初创公司正面临获取英伟达显卡的难题。中小型企业被迫以高价争夺剩余的算力服务器,处境日益艰难。

数位相关企业的创始人与投资人透露,此次算力短缺已影响到多家获得知名资本支持的头部AI初创公司,其投资方包括红杉资本、创始人基金、通用催化剂创投、安德森·霍洛维茨基金等顶级机构。一位知情人士表示,迫于算力紧张,通用催化剂创投的合伙人赫曼特·塔内贾已向所投资企业的创始人发放调查问卷,以了解各家获取GPU算力的具体情况。

塔内贾在问卷中写道:“我们收到大量反馈,算力资源,尤其是GPU的使用权,已成为各位今年发展的最大瓶颈之一。”

当前的市场状况与2023年初极为相似:当时各大云服务商收回了公有云算力,优先保障内部业务与OpenAI等核心大客户。为缓解算力短缺,安德森风投、指数创投等机构纷纷自建GPU资源池,为旗下投资的企业提供保障。

但与2023年AI应用尚处萌芽阶段不同,如今AI代码开发工具的需求爆发,进一步加剧了芯片短缺。云服务商高管与初创企业负责人表示,随着Anthropic等头部AI开发商、自动化代码工具厂商的算力需求激增,云平台正在大幅削减中小客户的GPU配额。

为应对危机,通用催化剂创投正在筹划解决方案,计划通过搭建共享算力池、直接代表企业谈判等方式,帮助所投资的初创公司稳定获取GPU资源。

芯片供不应求的局面,使得云服务商得以提高英伟达算力服务器的租赁价格。此前许多云厂商在GPU业务上盈利困难,涨价措施显著改善了其利润空间。

然而,成本上涨严重挤压了AI企业的生存空间,图像生成AI模型研发商Krea便是一个典型案例。这家成立四年的初创公司累计融资8300万美元,投资方包括安德森风投、贝恩资本风投。

Krea的联合创始人兼首席执行官维克托·佩雷斯介绍,半年前多家云厂商争相合作,公司以每芯片每小时2.8美元的价格,签下了数百颗英伟达布莱克韦尔芯片的半年租赁合约。然而最近一个月,当企业计划采购更多算力从零开始训练大模型时,多家云厂商的销售人员拒接电话、消极应对。

即便后续取得联系,对方也直接大幅提价,并强制要求签署长达三年的长期合约。

“有的销售直接失联,有的声称没有可用资源,还有的强行绑定不合理合约。”佩雷斯说道。

他补充说,企业在评估多款算力集群方案期间,相关资源短短几天内就被其他客户抢购一空。

最终,Krea被迫签订为期一年的新合约,续租数百颗同款芯片,单价涨至每小时3.7美元,涨幅达32%。对比行业其他报价,这个价格已经相对较低。

佩雷斯坦言:“无法稳定获取算力、支撑平台运行与模型训练,才是我们最大的隐患。小幅涨价尚可承受,断供才是致命打击。”

另有一位初创企业创始人表示,其计划租赁近千颗高互联集群GPU,英伟达销售直言,头部云厂商的算力资源极度紧张,大量客户排队争抢,难以匹配需求。该集群单日租赁成本超过7万美元,目前仍在艰难寻找资源。

合约集中到期,供需矛盾加剧

雪上加霜的是,微软、亚马逊、CoreWeave等头部云厂商纷纷敲定了数十亿美元的长期合作,为Anthropic、OpenAI锁定了海量GPU资源。即便如此,伴随业务爆发式增长,Anthropic依旧深陷算力短缺的困境。

短缺的另一核心诱因是:大量AI初创企业早年签订的两至三年云服务合约集中到期,云厂商借此机会大幅提价,或将存量算力重新分配给付费能力更强的客户。

知情人士透露,微软Azure管理层已内部通知员工,算力长期紧缺的现状至少将持续至2026年底。

某AI云服务商的CEO透露,曾计划将一家合约到期企业的GPU集群,转让给愿意溢价约30%的新客户;原企业紧急协商挽留后,最终以涨价方式保住了算力资源。

GPU云服务商Lightning AI的首席执行官威尔·福尔肯表示,公司线上运行着约4万颗GPU,但积压了近40家企业的租赁需求,合计缺口高达40万颗芯片。过去六个月算力租赁价格涨幅超过25%,单芯片时薪从1.6美元攀升至2美元以上,热门资源溢价更高。该平台的主力芯片为英伟达上一代霍珀架构产品。

微软推行“闲置回收”管控政策

据微软内部员工透露,受大客户与内部业务算力需求挤压,Azure已全面收紧中小客户的服务器租赁配额,不少中小企业需要排队数月才能扩容GPU资源。

微软长期将顶级旗舰芯片集群优先供给OpenAI及自身业务,同时持续为Anthropic新建专属算力集群。普通客户的GPU分配权限,完全取决于其在Azure的消费规模,以及新增算力合约的付费承诺。

内部信息显示,近几个月微软硬性要求,想要租用英伟达布莱克韦尔高端芯片的客户,必须承诺至少采购1000颗芯片、签约一年以上,单份合约最低成本达数千万美元。

即便是英伟达的老旧款芯片,普通客户在Azure平台的预约周期也长达数周甚至数月。

微软采用分级体系管理客户优先级:一级客户约一千家,为年度高额消费的头部企业,享有算力优先分配权;二级客户消费体量中等,配备专属销售对接;三级客户为中小微企业,由渠道合作代理商负责对接。

未签订大额预留合约、采用按需付费模式的客户,将面临漫长的排队周期。同时微软严格监控算力使用率,即便是短期闲置数小时,也会被收回GPU使用权。

此外,微软正在清退初创扶持计划的免费算力权益。通过“微软初创项目”免费申领服务器额度的企业,若无法满负荷使用芯片,将被永久收回GPU访问权限。

自建算力成新出路

面对云厂商的层层限制,部分初创企业开始选择绕开云平台,自建算力。

油气行业AI智能体研发企业Collide去年完成了1400万美元种子轮融资,创始人科林·麦克莱兰表示,受够了算力排队、合约限制等问题,公司计划投入约50万美元采购英伟达GPU,搭建私有算力集群。企业考虑直接租用数据中心机房,自主部署硬件设备。

麦克莱兰认为,短期自建硬件的成本远高于租赁,但能够彻底规避算力断供与价格波动的风险。长期来看,多年租赁的综合成本反而更高,自建模式更具性价比。

“关键时期缺乏算力,对企业是毁灭性打击。多数团队畏惧硬件运维,但我常年运营油井项目,早已适应这类重资产模式。”

责任编辑:刘明亮

新浪财经声明:此消息系转载自合作媒体,新浪财经登载此文出于传递更多信息之目的,文章内容仅供参考,不构成投资建议。

郑重声明:1.根据《证券法》规定,禁止编造、传播虚假信息或者误导性信息,扰乱证券市场;2.用户在本社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。