标签

黄仁勋怒怼厂商去CUDA:前提根本就是错的

发布时间:2026-04-19 13:35来源:微信阅读:7

耗时近两小时,黄仁勋正面回应了关于英伟达市值飙升至4万亿美元的种种质疑。

在“硅谷最受欢迎播客”的最新访谈中,黄仁勋的发言信息量极为丰富。

视频发布仅半天,在油管上的观看量便突破了10万次。

网友评论称:很少见到黄仁勋如此激动。🤣

为方便阅读,重点内容总结如下:

完整的万字实录及老黄的激烈反驳请见下文。

英伟达的核心壁垒

(主持人Dwarkesh Patel提问,以下简称Q)

Q:软件公司估值下跌,因大家觉得AI会让软件免费。有人天真地认为英伟达本质是做软件,制造外包,若软件变便宜,英伟达护城河还在吗?

黄仁勋:归根结底,必须有东西把电子变成Token。

这种电子转Token的过程,加上时间让Token增值,很难变得同质或廉价。

这段旅程不可思议。让Token增值涉及艺术、工程和发明,我们正见证这一过程,远未结束,我不相信你的假设会成真。

当然,我们会提高效率。你的提问方式符合英伟达精神:输入电子,输出Token,中间就是英伟达。

我们付出努力,尽量少干预,实现最大转化。非必须做的交给合作伙伴,融入生态。

如今英伟达拥有最大生态系统,涵盖上下游、计算厂商、开发者和模型制作者。

AI像五层蛋糕,生态覆盖每一层。我们尽量少做,但必须做的部分极难,不会同质化。

我不认为软件公司会失势,多数是工具。Excel、PPT等都是。我反而认为Agent和用户数会指数增长,工具部署会激增。

如今受限于工程师数量,但未来Agent会支持工程师探索设计空间,现有工具不会废弃。

工具普及会让软件公司增长,只因Agent效率不够。要么公司自建Agent,要么Agent进化高效使用工具,两者会结合。

Q:申报文件显示,英伟达在代工、内存、封装采购承诺近1000亿。SemiAnalysis称实际达2500亿。

解释是护城河在于锁定稀缺组件供应链。这是未来几年最大护城河吗?

黄仁勋:这是我们能做到的,别人很难。

上游有巨大承诺,显性的如合同,隐性的如合作伙伴投资。我会对CEO说行业规模、原因和未来,说服他们投资。

我不断传递信息、激励并达成一致,让他们投资。他们为我投资,因为知道我能承接供应并销售。

事实是英伟达下游需求巨大,他们愿为此投资。

GTC规模惊人,汇聚AI全宇宙。我把上下游聚在一起,看进展,见初创公司,见证我说的一切。

我花大量时间向生态传递未来机会信息。

有人说演讲是发布会,其实我很“折磨人”,像上课。我故意这样,确保上下游理解变化、原因、时机和规模,并系统推理。

回到护城河,我们为未来准备。若业务达万亿,供应链已备好。若无市场覆盖和驱动力,供应链无流动性,没人愿支持扩展。我们靠庞大下游需求支撑规模,大家已见证。

Q:具体了解上游能否跟上。过去几年收入翻倍,全球浮点运算能力增长超三倍。

黄仁勋:在如此规模下收入翻倍令人难以置信。

Q:确实。但逻辑芯片上,你们是台积电N3最大客户,N2主要客户。SemiAnalysis预测今年AI占N3产能60%,明年86%。

占据多数产能如何翻倍?AI算力增长是否因上游放缓?如何让晶圆厂产能每年翻倍?

黄仁勋:瞬时需求超全球供应总量。可能被“水管工”数量限制。

Q:明年GTC该请水管工参会(笑)。

黄仁勋:主意不错(笑)。需求超供应是好事。反之则不妙。若差距大,行业会聚合。比如现在没人谈CoWoS封装了。

Q:为什么?

黄仁勋:原因是过去两年大量投资,规模翻倍。现在状态不错。台积电知道CoWoS需跟上逻辑和内存需求,扩展到同步水平。曾被视为特种技术,现成主流。

现在能广泛影响供应链。早期我就预言,美光桑杰等人相信并投资,加倍投入LPDDR和HBM合作,带来巨大发展。晚来的人也到场了。

关注每个瓶颈,提前预判。与Lumentum、Coherent等合作重塑供应链。围绕台积电建完整供应链,COUPE项目合作,发明新技术,授权专利保持开放。

通过新技术、工作流、检测设备和投资,帮助伙伴扩产。通过生态构建,确保供应链支持规模化发展。

Q:有些瓶颈比其他容易,比如CoWoS扩产可能相对容易——

黄仁勋:顺便说,我挑了最难的例子。

Q:哪个?

黄仁勋:管道工和电工。

这让我担忧“末日论者”,他们总说工作消失。若劝人不当软件工程师,将短缺。

十年前悲观者说不要当放射科医生,现在网上还有视频。但事实相反,我们缺放射科医生。

Q:回到瓶颈问题。如何每年造2倍逻辑芯片?受EUV限制,如何增长?

黄仁勋:可以快速扩展。不难,需需求信号。造一个能造十个,进而百万个,都易复制。

Q:介入多深?会和ASML说吗:“看三年需求,为每年2万亿营收,需更多EUV。”

黄仁勋:有些直接说,有些间接。说服台积电,ASML自然被说。关键是瓶颈。台积电被说,几年内EUV设备就够。

我观点:没瓶颈能持续超两三年。

同时,计算效率进步巨大。Hopper到Blackwell效率提升30-50倍。因CUDA灵活,能开发新算法。提高效率同时增产能。这些问题不担心。真风险是下游,如限能政策。无能源无工业,无能源无制造企业。

我们要重塑美国工业,带回芯片、计算、封装制造,造电动车、机器人、AI工厂。无能源不行,解决需长时间。芯片产能2-3年,CoWoS也是。

Q:有趣。嘉宾观点相反,我缺技术知识判断。

黄仁勋:好消息是你现在和专家交谈(笑)。

TPU无威胁,英伟达在“重新定义计算”

Q:关于竞争对手。世界前三AI模型两个Claude和Gemini在TPU训练,对英伟达意味着什么?

黄仁勋:我们构建的东西与TPU非常不同。

英伟达构建加速计算,而非仅TPU。

加速计算用途广:分子动力学、量子色动力学、数据处理等,还有流体和粒子物理,以及AI计算。

加速计算更多样。虽AI重要,但计算范围更广。

英伟达重新定义计算,从通用到加速。市场覆盖远超TPU/ASIC。唯一能加速各种应用的公司,有庞大生态,框架算法都能运行。

另外,多数自建系统不为方便他人设计。我们的系统无处不在,因任何人都能操作。

若租赁,需多行业客户消化资源。若自用,我们支持,如Elon Musk的xAI。因支持任何运营商,可用于科研药物发现,如Eli Lilly。可帮他们操作超级计算机,加速生物流程。

TPU无法覆盖大量场景。英伟达CUDA是出色TPU,但能处理数据处理、计算、AI全生命周期。市场机会更广。因支持所有类型应用,在任何地方建英伟达系统,都有客户需求。这是不同概念。

Q:长问题。营收惊人,非来自制药或量子。每季600亿因AI前所未有且增长快。

所以问题是,AI什么最合适?我不熟细节,但朋友说:“TPU是大型行列式阵列,适合矩阵乘法,GPU灵活,有分支或非规则内存访问时表现好。”

但AI本质是重复矩阵乘法。不需浪费芯片面积在warp调度器或内存组切换上。TPU针对优化。想知道你怎么看。

黄仁勋:矩阵乘法是重要部分但非全部。若开发新注意力机制、解耦或新架构如混合SSM,需通用可编程架构。若融合扩散和自回归模型,也需。我们能运行一切。优势是架构让新算法发明变容易,因是可编程系统。

发明新算法是AI进步原因。TPU受摩尔定律限制,增速约25%。唯一实现10倍或100倍跃升的,是根本改变算法和计算方式。

这是英伟达核心优势。从Hopper到Blackwell 50倍改进……我宣布Blackwell比Hopper能效高35倍时,没人信。后来Dylan说我“故意保守”,实际50倍。不可能仅靠摩尔定律。我们通过MoE等新模型,在系统中并行化、解耦、分布式实现。无CUDA支持,开发新内核几乎不可能。

优势是架构编程灵活,协同设计能力强。可卸载计算到架构如NVLink,集成到网络如Spectrum-X。同时影响处理器、系统、架构、库和算法。无CUDA,不知从哪开始。

Q:有趣问题,关于英伟达客户群特点。目前你们60%的收入