黄仁勋坦言中国业务停滞:美国制裁下的意外“赢家”
2026年5月,黄仁勋在接受美国国会两党合作的“特别竞争研究项目”(Special Competitive Studies Project)采访时表示:
“我们在中国的业务现在已经完全停滞了In China,we have now dropped to zero”
实际上,早在去年10月,黄仁勋就曾指出“我们在中国的高端AI芯片市场份额已从95%降至零”,但当时华尔街并未给予足够重视。
毕竟,凭借北美科技巨头的强劲需求和中东地区“主权AI”的大额订单,英伟达管理层预测本季度收入将达780亿美元,同比增长约77%。
就连黄仁勋本人也曾承认,尽管因H20禁售遭受了45亿美元的损失,但非中国市场的强劲增长已成功弥补了这些亏空。
既然营收并未受损,黄仁勋为何要“哭穷”?
他究竟在担忧什么?
事实上,真正的问题并非那500亿美元的差额。
金钱是次要的,市场份额才是关键。让这位硅谷的“皮衣刀客”夜不能寐的,是美国政府正亲手摧毁英伟达赖以生存的市场壁垒。
一、荒谬的25%“保护费”
让我们回顾2025年底。
当时,一家美国智库发布报告,断言“美国AI芯片的性能将在2027年达到中国最先进芯片的17倍”。
这篇报告的内容,感兴趣的朋友可以自行查阅。
言下之意便是:封锁已奏效,中国AI发展即将陷入困境!
紧接着,美国政府又提出了一个极具特朗普风格的“奇特交易”:
他们允许英伟达、AMD向中国出口更先进的H200芯片,但前提是,每售出一颗,必须将25%的收入作为“保护费”上缴美国国库。
美国人的如意算盘打得噼啪响:一方面,他们只销售H200,以此卡住最顶尖的Blackwell芯片不出口;另一方面,又能从中国互联网巨头那里大肆敛财;同时,还能利用这笔税收补贴本国的科技企业。这可谓是“一石三鸟”的策略。
如果是在2023年,即便价格上浮50%,国内的科技巨头也会争相抢购这些芯片。然而,到了2026年,情况已然不同。
3月份,黄仁勋曾高调宣布“已接到中国客户的H200订单”。
然而,4月份,美国商务部在听证会上就此予以否认:“截至目前,我们尚未向他们出售任何芯片。”
好消息:中国买家不再购买!
坏消息:中国买家不再购买!
那么,中国买家为何停止采购?
一份未公开的内部战略指导文件显示:由于长期面临供应中断的风险,国内的算力补贴和采购已全面且平稳地转向了国产替代。
中国已经看清了这一局面:
如果此时为了图省事而重新依赖英伟达H200,那么过去三年多来,国家投入千亿资金、历经艰辛才度过“冷启动”阶段的国产AI芯片产业链(包括代工生产线以及寒武纪、摩尔线程等企业),将面临需求骤减的灭顶之灾。
既然已被逼上绝境,中国索性直接拒绝了英伟达的供应。
二、生态脱钩
那么,在被拒绝供应后,事态将如何发展?
过去十年,英伟达真正称霸全球的并非其芯片本身,而是其CUDA软件生态系统。
CUDA犹如AI时代的Windows操作系统,导致全球开发者严重“路径依赖”。只要中国50%的顶尖AI研究人员还在使用CUDA编写代码,中国的AI产业就将永远受制于英伟达。
在正常情况下,要打破CUDA的垄断地位,其难度不亚于登天。没有哪家中国的大模型公司愿意承担模型训练失败的风险,去适配那些极其难以使用且充满漏洞的国产底层软件。
然而,美国商务部的禁令却恰好帮助了中国——由于中国企业“无卡可用”,面临生死存亡的压力,即使前期效率可能减半,开发者们也被迫硬着头皮,开始转向华为的CANN架构以及寒武纪和壁仞的工具链。
短短三年时间,由于失去了美国芯片的“倾销”,中国本土市场演变成了一个优胜劣汰的“练蛊场”。
到了2026年,市值飙升至1.3万亿美元的中国“硅先锋”们(如寒武纪、摩尔线程等)不仅生存下来,而且发展得相当不错;
华为也宣布将其CANN生态开源。
用黄仁勋在采访中的话来说就是:“当你把一个像中国这么大的市场拱手让人,这就叫弄巧成拙largely backfired。”
三、逼出来的奇迹
那么,中国是如何度过这三年算力短缺的困境的?
这或许是整个AI发展史上最精彩的“逆风翻盘”案例。
面对阿斯麦EUV光刻机的禁运以及高端内存(HBM)的封锁,中国探索出了两条极具本土特色的突围路径。
第一条路,被称为“穷鬼创新”(资源约束型算法突围)。
去年(2025年初),DeepSeek R1的横空出世令硅谷震惊,因为DeepSeek凭借其首创的MLA机制和算法极限压缩技术,将训练成本降低到了OpenAI的几十分之一。
如今,这颗“火种”已然燎原。
今年,面对持续收紧的算力限制,DeepSeek最新一代的V4模型已开始大规模迁移至华为昇腾950PR芯片,并直接针对华为底层的CANN架构进行代码重构。
黄仁勋将这一景象罕见地形容为“对美国而言最糟糕的结果”——这意味着中国最顶尖的算法团队正在实质性地摆脱对美国硬件的依赖。
不仅是华为和DeepSeek,整个中国AI领域都在加速进化!
阿里平头哥、百度昆仑芯在积极迭代自主研发路线;而以寒武纪(推出对标H100的思元690)、摩尔线程、壁仞、沐曦为代表的“硅先锋”军团,在2026年初市值已飙升至1.3万亿人民币以上。这些企业在努力兼容旧版CUDA代码的同时,也开发出了极具本土特色的算法优化方案:
算力不足,就通过算法层面的极致精简来弥补;通信带宽受限,就利用复杂的路由机制(MoE)来实现迂回。
美国智库CSIS表示:美国的封锁不仅没有压制中国,反而成为了最严酷的“自然选择”。它迫使中国AI领域走上了一条“高效低耗、软硬协同”的另一条科技发展道路,并在此刻蓬勃发展。
第二条路,被称为“重工业算力”(系统级暴力堆叠)。
单卡性能落后怎么办?既然中芯国际的7nm制程受到限制,华为给出的解决方案是:依靠强大的系统工程能力。
例如,2025年推出的CM384集群,是华为对抗英伟达GB200 NVL72的终极武器。在一个包含16个机柜的Pod中集成了384颗昇腾910C芯片,并通过近7000个400G光模块实现了全互联。
根据权威机构SemiAnalysis的分析,CM384虽然单系统功耗高达559千瓦,是NVL72(145千瓦)的近4倍,但它能够提供约300 PFLOPS的稠密BF16算力(是NVL72的1.7倍),拥有49.2 TB的总HBM容量(是NVL72的3.6倍),以及2.1倍的总内存带宽。
换句话说,尽管功耗巨大且占地面积广阔,但在特定任务上,其表现能够与英伟达的顶级系统相媲美甚至超越。
而且,在中国特殊的国情下,这种方案是合理的。
中国拥有充沛且廉价的电力资源(来自煤炭和水电),华为巧妙地利用了中国的“能源禀赋”来弥补“硅工艺的不足”。
四、平行世界
回顾过去三年,华盛顿的决策者们确实“成功”了——他们延缓了中国积累绝对算力的速度,为美国超级计算中心的建设争取了宝贵的时间。
SemiAnalysis估计,若无制裁,华为目前的年产能可达500万片以上,而现在则被严格限制在80-100万片左右。中国AI实验室在尖端模型(如对标OpenAI下一代产品)的长上下文训练稳定性以及绝对算力密度方面,仍然存在客观差距。
美国投入2859亿美元,中国仅花费124亿美元,却将AI差距缩小到2.7%?2026年斯坦福发布的423页AI报告中的10个关键数据……
但也要感谢他们:
因为他们用制裁的铁锤,帮助中国打破了买办式的科技幻想,并在一定程度上摧毁了美国的“软实力护城河”:过去,CUDA生态是英伟达最强大的武器。只要中国开发者还在使用CUDA,中国的大模型就永远建立在英伟达的地基之上。但制裁打破了这种商业平衡。
正如黄仁勋所警告的,美国强行催生了一个与自身不同的、完整的硬件与软件生态系统。一旦这个生态系统建立并产生用户粘性,即使美国未来完全取消制裁,中国的大型科技公司也绝不会轻易将核心技术控制权交还给外国企业。
美国将继续依靠最先进的台积电工艺,在单卡算力和前沿大模型领域保持领先地位;
而中国,则沿着“受限芯片+重工业系统互联+极限算法优化+独立软件生态”的道路,在终端AI、具身智能(机器人)以及商业化落地方面疯狂渗透。
一旦中国成功构建了这套“不依赖美国高端硅片”的全栈AI体系,必将向那些急需AI能力但预算有限的中东、东南亚和拉丁美洲等“全球南方”国家倾销——这才是黄仁勋口中“对美国而言最可怕的后果”。
在这个无限的游戏中,算力霸权从未是永恒的。
这三年,中国AI失去的是曾经唾手可得的英伟达旗舰级显卡;但获得的,却是一个不再存在明显短板、经过千锤百炼而真正拥有全栈能力的强大躯体。





