黄仁勋最新解读AI:盈利时代已至,算力即收益
北京时间周四凌晨,全球市值最高企业英伟达召开了年度股东大会。作为AI领域的领军人,黄仁勋在会上指出,关于AI投资回报的疑问已经“有了定论”。
在业务汇报环节,黄仁勋多次重申,AI数据中心本质上是“制造词元(token)”的加工厂,词元能够转化为代码、解答、设计与服务,因此每个token均等同于利润单位。
其中,最提振市场信心的一句话是:实用型AI已然降临,并且已经开始创造收益。
黄仁勋同时指出,英伟达的系统或许并非购置成本最低的,但能产出成本最低的词元以及最高的词元吞吐量——进而带来最高的营收。
换言之,英伟达的客户购入的并非单纯的服务器集群,而是在打造具备创收能力的AI工厂。
这一商业逻辑也印证了英伟达极其亮眼的财务数据。公司全年营收飙升65%至2160亿美元,营业利润攀升60%至1300亿美元,经营性现金流达1030亿美元,并回馈股东410亿美元。其中,数据中心板块营收大涨68%至1940亿美元。
作为英伟达迈向下一阶段的增长动力,Vera Rubin架构现已迈入全面量产阶段。
黄仁勋表示,Hopper专为预训练设计,Blackwell将推理拓展至机架级别,而Vera Rubin则是专为智能体而生。智能体需要持续思考、调取数据库、使用工具并执行代码,若CPU处理速度滞后,GPU便会处于空闲;而在AI工厂内,GPU闲置就等同于营收流失。
除AI工厂外,黄仁勋还将“物理AI”视作下一轮增长浪潮。他提出,机器人、汽车与工厂将化身现实世界中的智能体,具备感知、推理、规划及自主行动的能力。英伟达的路径是通过AI工厂训练模型,利用Omniverse开展仿真,再借助Jetson等计算平台让模型在机器人及设备上运转。
黄仁勋亦对长期增速及ASIC芯片的冲击保持乐观,强调“此轮建设周期将以数十年来计算”,且英伟达的基础设施能赋予“最优的推理经济效益”。
在股东回报维度,黄仁勋透露,计划于今年、明年及未来,将半数或更多的自由现金流回馈给股东。
年度股东大会的投票环节整体平稳。股东以咨询投票的方式通过了高管薪酬方案,并批准10名董事连任。此外,一项要求修订公司章程、让所有股东投票事项均依简单多数原则表决的外部股东提案获批。
黄仁勋业务更新(Business Update)
对英伟达乃至整个计算产业而言,这是极不平凡的一年。每隔10至15年,计算机产业便会经历一次重构:从大型机到PC,从PC到互联网,从互联网到云,再从云到移动云。而此次重构的规模更为宏大。
在过去60载中,人类编写程序,计算机负责执行。这种范式已被颠覆。依靠AI,计算机能够理解、推理、规划、使用工具,并执行有价值的工作。计算机已不再仅仅是工具。在AI时代,它化身为懂得使用工具的助手。由此延伸,数据中心也不再仅是“工具棚”,而是由数字助手构成的AI工厂,是生产数字智能的基石。
英伟达正为这一新时代构筑计算基础设施。
两年前,生成式AI引发全球瞩目。ChatGPT能写文章、绘图、总结及答疑。随后,推理型AI掌握了思考能力。如今,智能体AI正式登场。智能体能够调用工具、调取记忆、编写代码、协同其他智能体、验证结果,并持续运作直至任务达成。
软件编程是企业端首个重大突破性应用场景。这点至关重要:AI现已具备实用价值。当AI能执行有价值的工作时,token便拥有了价值;当token能带来利润时,对算力的需求便会激增。
来看看实例。GitHub开发者在2023年合并了3亿个pull request(拉取请求),2024年达4亿个,2025年达5亿个,呈现出清晰且稳健的上升轨迹。但在2026年前几个月,该速度几近翻了三倍。显然,这意味着全球约3000万软件开发者——他们年薪总额约3万亿美元,其工作支撑着全球100万亿美元的经济运转——正被AI赋能。借助智能体,同等规模的劳动力如今正创造着近9万亿美元的产出,增加了6万亿美元。
编程仅为需求驱动力之一。实用型AI已然降临。AI投资回报率的疑问已有定论,各行各业均在竞相应用智能体AI。
英伟达营收增幅65%,达2160亿美元。营业利润增幅60%,达1300亿美元。摊薄后每股收益增幅67%,达4.90美元。我们创造了1030亿美元经营现金流,并向股东回馈410亿美元。
数据中心营收达1940亿美元,增幅68%。Blackwell显著拓宽了英伟达基础设施在各类客户群内的覆盖面,涵盖超大规模云厂商、云服务提供商、AI实验室、工业企业及主权客户。模型开发商与超大规模云厂商均已累计部署数十万颗Blackwell GPU。AI工厂的建设仍在各大主要行业迅猛扩张。Capital One、现代汽车集团、Jane Street及礼来等企业,正扩建英伟达基础设施以部署AI。
国际业务营收增幅超三倍,突破300亿美元。近40个国家及地区——代表着50万亿美元GDP——正建设由英伟达基础设施驱动的AI工厂。
AI基础设施不再是试验品,它已步入生产阶段。AI不单是模型,它是新兴的产业。可将其视作五层蛋糕:能源、芯片与系统、基础设施、模型及应用。
传统数据中心负责存储与提供文件服务。AI工厂则制造token。token会转化为代码、解答、设计、行动与服务。
实用型AI是盈利的。每一个token皆为利润单位,这正是算力需求极度旺盛的根源。客户购买的不是计算机,而是在搭建具备创收能力的AI工厂。
(AI)工厂的架构至关重要。核心在于,该工厂能创造多少营收,以及成本几何。推理即生成token的过程,而英伟达Blackwell确立了标杆。在SemiAnalysis的InferenceX基准测试内,Blackwell被认定为“推理之王”,提供最低的单token成本,并实现较第二名平台高出30倍的token吞吐量。
这便是架构如此关键的缘由。英伟达系统或许并非采购价最低的,但英伟达能生成成本最低的token、最高的token吞吐量,以及最高的营收。
Vera Rubin是下一步。Hopper专为预训练设计。Blackwell将推理拓展至机架规模。Vera Rubin则是为智能体而生。
智能体AI重塑了计算模式。智能体会思考、调用工具、访问数据库、检索记忆、执行代码,并反复调用应用,直至任务完成。运行于GPU上的大语言模型负责思考,而CPU必须同步。若CPU遭遇瓶颈,GPU便会空闲。而在AI工厂内,GPU闲置便意味着营收流失。
这便是Vera至关重要的缘由。Vera是面向智能体的CPU,Rubin是负责思考的GPU。NVLink、Spectrum-X、BlueField上的存储与安全能力,及软件,共同将这些系统串联。
事实上,英伟达是唯一兼具三项网络业务的企业。NVLink将一个机架内的GPU连成一台超级计算机。Spectrum-X是专为AI打造的以太网,能在AI工厂内外横向扩展,其规模现已超越所有其他以太网网络同行的总和。InfiniBand则为全球最大AI与科学计算系统提供最低延迟网络。
这些技术相融合,使AI工厂能够实现从GPU至机架、从数据中心内部至跨数据中心的全局优化。
Vera Rubin并非单颗芯片,而是AI工厂平台,且生态系统已开始运转。Vera Rubin已全面投产。每一家主流模型开发商、公共云、AI云及超大规模云厂商,均在筹备基于它开展建设。
Vera开启了一个全新市场。迄今为止,每一颗CPU皆是为人类设计。我们生活在以秒计时的世界。智能体则生活在以纳秒计时的世界。CPU让智能体等待的每瞬,皆是整栋建筑内最昂贵之物——GPU——处于闲置的瞬间。
因此,我们从零起步打造了一颗全新的、面向智能体的CPU。这是全新市场。服务于人类的CPU,是按核心切分与出租的。智能体并非租用核心,而是要求极速响应。未来将涌现数十亿智能体,它们需要专属的CPU。
我们深信,Vera将成为公司史上最具分量的产品发布之一,订单已纷至沓来。
CUDA是我们历来最重要的投资之一。20年来,我们始终深耕同一加速计算架构。装机基础吸引开发者,开发者缔造突破性应用,应用开拓新市场,新市场又扩张装机基础。该飞轮正持续加速。
CUDA-X是构建于CUDA之上的库栈。这些库乃英伟达的皇冠明珠。它们攻克了科学及工业界部分最棘手难题,涵盖计算光刻、优化、基因组学、物理、数据处理、机器人、AI、无线网络等领域。
如今,这些库正化为智能体的工具。本周我们发布了BioNeMo,这是一套面向智能体的数字生物学及药物发现工具。
英伟达兼具垂直整合与横向开放。我们构建完整技术栈,从而能对系统实施端至端优化。随后我们将其开放,让全行业均能于其上构建。
我们业务版图广阔,且正愈发多元。为便于理解,我们现以两大市场平台来描述英伟达:数据中心与边缘计算。
在数据中心领域,我们服务于两大市场:超大规模数据中心,以及AI云、工业与企业市场。我们的客户群多元且持续壮大。
边缘计算囊括PC、工作站、游戏、AI基站、机器人及汽车。我们能服务所有这些市场,源于我们具备统一架构、单一软件栈,以及丰富生态。
物理AI是英伟达的下一波增长浪潮。物理AI即现实世界中的智能体AI。机器人、汽车与工厂将具备感知、推理、规划及在动态环境中运行的能力。
英伟达开创了该领域,并构建了完整闭环。AI工厂训练模型;Omniverse在虚拟世界中对其进行仿真;NVIDIA Jetson计算机在机器人中运行;Cosmos则是驱动这一切的世界基础模型。
机器人和机器人系统正于各行各业中被塑造,涵盖交通、制造、手术机器人,至酒店与服务业。
过去数月,AI获得了巨大加速。最后我想重申几点:实用型AI已然降临,且能创造收益。因此,算力即营收。Vera Rubin已全面投产。Vera正开启一个专为智能体打造的CPU新市场。每家企业正蜕变为智能体公司,它们均运行于英伟达之上。
AI时代正全速迈进,英伟达正构筑驱动该时代的基础设施。
伴随成长,我们将持续加大研发投入,投资生态系统,并向股东回馈资本。我们近期宣告大幅提升股息,并扩大股票回购计划。我们计划于今年、明年及未来,将半数或更多自由现金流回馈给股东。
谢谢。
问题:当前AI基础设施建设的可持续性如何?你们业务的主要驱动因素会在什么时候成熟,增长又会在什么时候放缓?
黄仁勋:正如我在演讲中所言,AI不单是模型。它代表着计算领域的一场根本性变革。60年来,计算主要在于检索、存储与传输信息;而当下,计算正被AI重塑,变为生成智能。
Token是智能的底层单位。它们在一种新型数据中心——AI工厂——内被制造,并借由商业化创收。算力越强,token越多,营收便越高。
此轮建设周期将以数十年为尺度衡量,类似于电网、交通系统及互联网等关键基础设施建设。我们深信,这将成为人类史上规模最宏大的基础设施建设。
智能体AI正加速基础设施投资,因这是AI首度真正开展实际工作,并创造真实经济价值。伴随各组织大规模制造智能,对AI工厂的需求将远超现有云计算,延伸至企业、主权国家及区域性AI云。
英伟达凭借全栈、端至端协同设计的基础设施,及支撑这些项目的大型合作伙伴生态,能以独特方式推进AI工厂建设。
下一个主要增长阶段为物理AI,而这仅是开端。随时间推移,AI将从数字世界步入机器人出租车、人形机器人及工业系统,使这些机器能在物理世界中感知、推理,并以自主方式行动。
驱动物理AI需新一轮基础设施投资。在此领域,英伟达提供AI基础设施、Omniverse仿真与数字孪生平台、开放模型、Jetson Thor嵌入式计算平台,及用于大规模开发与部署物理AI的软件栈。
我们前方仍有漫长的增长跑道。
问题:英伟达GPU目前支撑着全球大多数人工智能训练基础设施,但随着推理工作负载超过训练,英伟达有多大信心认为GPU架构仍将是大规模推理的首选平台?
黄仁勋:英伟达确实极擅长训练。而凭借Blackwell,我们亦确立了在推理领域的领先地位。
推理正让AI实现商业变现。因数据中心受限于电力,其token吞吐量与营收潜力取决于AI基础设施的每瓦性能。
在SemiAnalysis的Inference-X基准测试内,Blackwell被誉为“推理之王”,实现了最佳每瓦性能、最低token成本,及高出30倍的token吞吐量。
在最新一轮MLPerf推理基准测试中,我们斩获连续第七次胜利。对于AI智能体,Artificial Analysis的New Agent Perf结果显示,较之Hopper,Grace Blackwell 300 NVLink 72系统在每兆瓦功耗下可运行的智能体数量最多提升20倍。
此等卓越性能,是英伟达在芯片、系统、算法与软件层面进行极致协同设计的成果。英伟达AI基础设施提供最优性能,故而也提供最佳推理经济效益。
但我们的优势不单在于领先性能。我们庞大的装机基础让开发者能触及最多AI用户。英伟达可编程GPU架构运行超7000个应用,为云客户带来最大营收契机,以及融资与承购潜能。
对于企业与主权客户,英伟达赋予无与伦比的部署灵活性、最广泛用于定制AI的领先开源模型,及业内最深度的IT生态支撑。
如今,英伟达绝大部分计算足迹皆用于推理。我们占据有利地势,有望进一步扩大份额,近期与Anthropic及苹果的合作公告亦印证了这点。
问题:能否更新一下资本回报政策?在股息和股票回购方面,投资者应该期待什么?
黄仁勋:英伟达为投资者提供一种独特组合:卓越增长、强劲利润率、自由现金流执行能力,及不断攀升的资本回报。
在最近一次财报电话会上,我们宣布季度股息提升25倍,并额外授权800亿美元股票回购。
基于我们对可持续市场增长及自由现金流创造能力的信心,我们计划于今年、明年及更长期内,向股东回馈50%或更多自由现金流,并随时间推移持续提升股票回购与股息。