AI算力瓶颈:一场迫在眉睫的供应危机
本文深度剖析了人工智能领域当前面临的供应紧张局面及其潜在的深远影响。文章指出,随着以编程助手为代表的AI应用呈现爆炸式增长,大型语言模型所需的tokens(文本片段)供应已捉襟见肘——根据OpenRouter的数据,今年第一季度周token消耗量激增至之前的四倍。供应短缺已迫使Anthropic和亚马逊在高峰时段实行了配额制度,OpenAI的财务主管Sarah Friar也坦承,由于算力不足,公司已放弃部分发展机会,甚至搁置了视频生成模型的开发计划。文章进一步揭示了供应链中存在的多个关键瓶颈:美国数据中心的建设因地方阻力而放缓;变压器、开关设备及燃气轮机等关键设备的短缺导致2至5年的漫长交付周期;而最主要的瓶颈则集中在英伟达设计的AI芯片以及内存芯片、CPU等其他硅片上。在硬件成本高企的背景下,雄厚的资金实力成为关键竞争要素——五大“超大规模企业”(亚马逊、谷歌、Meta、微软、甲骨文)今年的资本支出预计将超过7500亿美元,而OpenAI和Anthropic也宣布了数千亿美元的合作投资计划。英伟达更是通过提前锁定2026-2027年的大部分内存需求并投资多家科技公司,以巩固其供应链地位。文章强调,最大的利润将集中在这些供应瓶颈环节:英伟达的毛利率已从2019年的60%跃升至约75%,台积电的毛利率也超过60%(远高于普通代工厂的两倍),并且这些硬件巨头掌握着稀缺资源的分配权。高昂的芯片价格正促使软件公司考虑自主研发芯片以降低约一半的成本,然而,迄今为止只有谷歌成功实现了大规模量产,而要取代台积电的地位则更为艰难。埃隆·马斯克提出的“Terafab”计划,其预算高达5至13万亿美元,也反映了对未来算力需求的巨大预期。供应危机的最终结果将是延缓AI技术的普及进程:尽管推理成本在一年内下降了5至10倍,但这掩盖了企业为维持低价而进行的巨额亏损——OpenAI和Anthropic预计未来几年将蒙受数十亿美元的亏损。随着AI应用范围的不断拓展,token需求将呈现数量级的增长,届时模型制造商将不得不将不断攀升的算力成本转嫁给用户,迫使用户进行精打细算。未来,企业不仅需要考虑是否采用AI技术,更需要像评估人力成本一样,审慎考量AI使用效率的问题。
1. 供应危机;供应短缺
2. 瓶颈;咽喉要道
4. 片段;小段
5. 大量消耗
9. 正在发生
11. 阻止;威慑
33. 超大规模企业
38. 支付;掏钱
42. 巩固;支撑
45. 影响力;支配权
领袖专栏 | 算力说不
AI 供应危机已经到来
瓶颈正在改变 AI 的经济学
2026年4月30日
人工智能面临供应问题。随着全世界大量消耗 tokens——用于计量大语言模型输出的文本片段——这些 tokens 正在短缺。根据 AI 模型市场 OpenRouter 的数据,1月至3月期间,每周 token 消耗量翻了两番,部分原因是编程工具的使用日益增长。行业跟不上需求。
在模型制造商和科技巨头那里,配给制正在实施。Claude 的制造商 Anthropic 最近调整了条款,以阻止高峰时段的过度使用。亚马逊表示“产能限制”已经限制了其增长。ChatGPT 开发商 OpenAI 的财务总监 Sarah Friar 表示,该公司并未追求每一个机会,因为它没有足够的处理能力(或“算力”)。它最近取消了视频生成模型。
供应危机的后果可能是深远的。算力稀缺的世界将塑造 AI 的经济学,改变从利润分配到使用技术的激励等一切。
快速增加 AI 产能是困难的。特别是在美国,地方对新数据中心的反对已经减缓了建设进度。变压器、开关设备和燃气轮机的短缺造成延误;其中一些设备可能需要两到五年才能到货。最紧的瓶颈在于处理器。用于 AI 的芯片,例如全球最有价值公司英伟达设计的芯片,仍然稀缺。短缺还延伸到其他类型的硅片,包括内存芯片和中央处理器(CPU)。这些限制在短期内都不太可能缓解。供应链需要数年时间才能扩张,而硬件制造商的投资仍然比他们供应的超大规模企业更加谨慎。
当硬件昂贵时,资产负债表的规模比以往任何时候都更重要。无论你看供应链的哪个部分,只有少数公司拥有锁定所需硬件的财力和议价能力。今年,五大数据中心“超大规模企业”——亚马逊、谷歌、Meta、微软和甲骨文——将共同支出超过7500亿美元的资本支出。OpenAI 和 Anthropic 已宣布数千亿美元的合作和投资。据说英伟达已经提前很久购买了2026年和2027年部分时间所需的大部分内存。它还投资了一系列科技公司以巩固其供应链。
最大的利润将出现在瓶颈环节。AI 热潮尤其使英伟达和台积电受益——这家台湾制造商生产几乎所有最先进的芯片。芯片制造商的定价权已经变得像他们的晶体管一样巨大。英伟达的毛利率约为75%,高于2019年的60%。台积电的毛利率超过60%,大约是许多其他代工厂商的两倍。硬件巨头还对谁获得稀缺设备有支配权,尽管他们否认挑选偏好对象。
高价格正促使软件制造商自己做更多事情。定制芯片的成本可能只有从英伟达购买的一半左右。但它们并不容易设计。在这样做的软件公司中,只有谷歌成功地大批量创造了可行的替代方案,而其努力始于十多年前。取代台积电则更加困难。包括英特尔和三星在内的其他芯片制造商,在前沿技术上都难以与之匹敌。SpaceX 和特斯拉的老板埃隆·马斯克提出了一个“Terafab”计划,以与台积电竞争。其预估成本是异想天开的5万亿至13万亿美元。
供应危机的最后一个后果将是减缓技术的采用。到目前为止,AI 热潮一直基于这样一个乐观假设:回答查询只会变得更便宜。而且确实如此:“推理”价格在一年内下降了5到10倍。在印度等国家,AI 公司正在提供削价订阅以吸引用户。但这掩盖了企业为维持这些下降的价格而烧掉的大量现金。OpenAI 和 Anthropic 预计在未来几年将损失数十亿美元。随着两者准备上市,它们将渴望展示自己终有一天能够盈利。
随着人们为 AI 找到更多用途——包括在科技之外的应用,而科技目前是 AI 最受欢迎的领域——价格将会上涨。如果 AI 要改变经济,对 tokens 的需求将呈数量级增长。随着模型制造商转嫁其上升的算力成本,用户将不得不精打细算。今天,许多公司以是否在特定任务中使用 AI 来评判自己。日益增多地,就像对待人力一样,他们将不得不问自己是否在高效地使用 AI。■
这篇文章是《经济学人》领袖专栏的深度分析之作,以“Compute says no”(算力说不)为标题,巧妙呼应了英国情景喜剧《Little Britain》中的经典台词“Computer says no”,展现了《经济学人》一贯的文化素养和幽默感。
文章结构特点:
深刻洞察:
推荐一款看电影学英语利器小鹦看看