黄仁勋解析AI成本谜题:天价硬件如何产出廉价Token
想明白这个看似矛盾的说法,关键在于理解一个核心逻辑:硬件属于一次性投资,而Token则是持续性产出。
英伟达推出的GB200 NVL72服务器,单价突破300万美元大关,堪称当今最昂贵的商用AI设备。然而这台"天价设备"在全速运转状态下,每秒可产出150余个Token。以全天候24小时运行来估算,其年度Token产量堪称海量,摊薄到每个Token上的成本微乎其微。
举个形象的例子:花费百万元购入一台印钞设备,机器本身价格不菲,但印制出的每张纸币成本却仅有几分钱。英伟达的商业逻辑正是如此——投入的是昂贵的设备,产出的是廉价的成果。
不少人认为英伟达主营芯片业务,这其实是个普遍存在的误读。
实际上,英伟达售卖的是一整套AI基础设施体系。
硬件维度上,GB200 NVL72将72颗GPU芯片通过NVLink技术高速连接,构成庞大算力集群;软件维度上,CUDA生态系统覆盖了从模型训练到推理部署的全流程工具;服务维度上,英伟达持续拓展云端服务与AI企业级软件方案。
这三者有机结合,共同构成了英伟达的真实产品形态。
如果说芯片性能的领先是英伟达的"明线优势",那么CUDA生态就是其"暗线护城河"。
全球数以百万计的AI研发人员已深度依赖CUDA进行编程与运算。无论是学术前沿还是产业应用,从大规模模型训练到边缘端推理,CUDA都提供了成熟完备的开发环境。即便竞品在硬件规格上能够匹敌,开发者切换生态系统的代价依然极为高昂。
这类似于iOS与Android的较量——并非简单的硬件指标对决,而是全方位开发者生态的博弈。当研发团队适应某一平台后,迁移成本不仅涉及时间投入,更包括团队技术栈的重构、既有代码库的适配工作,以及未知风险带来的潜在损失。
黄仁勋直言不讳:"我们制造全球成本最低的Token。"这番话并非自我标榜,而是向业界释放清晰信号——AI应用门槛正迅速下降。
对广大用户及中小企业而言,这预示着:
•AI应用成本骤降:昔日调用大模型API单次费用可能高达数角钱,今后或将降至几分钱水平
•AI功能全面渗透:成本降低后,开发者将大胆把AI技术植入各类产品——从手机、汽车到家电乃至服饰
•中小企业普惠化:AI不再是巨头专属,小型团队同样能够调用顶尖模型
黄仁勋的推理十分明确:当Token价格降至足够低廉,全球软件都将迎来AI重构。
一个引人注目的细节在于:英伟达已完成对DeepSeek-V4 AI模型的适配工作,在GB200 NVL72平台上实现开箱即用性能突破150 tokens/sec/user。这印证了国产大模型在硬件兼容性上进展迅猛,并已赢得国际芯片领军企业的认可。
与此同时,本土AI芯片企业也在积极布局。华为昇腾、海光信息、寒武纪等品牌正加快产品迭代步伐。尽管短期内尚无法在绝对性能上挑战英伟达的市场地位,但"打造最低成本Token"已成为所有芯片制造商的共同追求。
这种良性竞争对产业发展利大于弊——选择增多意味着议价空间扩大,更激发出创新活力。
黄仁勋的言论实际上提供了一个评估AI发展阶段的有效标尺:
当AI使用成本降至如水电般低廉之时,真正的AI时代才算正式开启。
当前我们仍处于"水电初通"的阶段——虽然可用,但价格尚未足够亲民、普及程度仍待提升。英伟达押注的是:一旦Token成本降至谷底,算力普及必将催生出超乎想象的全新应用。
回望历史轨迹,个人电脑诞生之初同样价格高昂,随后摩尔定律使其演变为日常用品。智能手机亦遵循相似路径。如今AI产业正经历同样历程——昂贵的是GPU硬件,低廉的是Token产出,正如当年高价的是计算机、廉价的是算力。
这场豪赌,似乎正在逐步兑现。
本文依据英伟达官方资料整理分析,相关数据