标签

HBM开创者金正浩:内存才是AI核心,GPU实际利用率仅10%

发布时间:2026-07-05 19:29阅读:3

被誉为"HBM开创者"的韩国科学技术院(KAIST)金正浩教授提出了一个挑战传统认知的观点:人工智能的根本在于内存,而非图形处理器。

近期,韩国科学技术院(KAIST)电气工程系教授金正浩在一次视频采访中,系统性地探讨了HBM技术发展、AI计算格局以及未来半导体设计方向。

金正浩在业内享有"HBM开创者"的声誉,早在2010年代初期便携手SK海力士投身HBM1研发,随后主导了多项基础架构研究。此次访谈内容在科技与金融领域引发热议,其核心论点直击当前AI算力竞赛的深层矛盾。

金正浩在采访中揭示了一个令人震惊的数据:

"即便部署100万个GPU,实际有效工作时间仅有10%。"

他阐述道,每当ChatGPT生成一个单词,系统就需从HBM读取数据、执行运算、再存储回内存,"读写过程几乎占据了全部时长,GPU只能处于闲置等待状态。"即使借助算法改进,GPU利用率也难以超过30%。

这为他一贯坚持的核心观点提供了现实佐证:"人工智能等同于内存(AI = Memory)。"

金正浩对英伟达(NVIDIA)当前处境的评价相当尖锐。他指出,黄仁勋近来频频造访韩国、参与娱乐节目、品尝炸鸡啤酒、会晤各界人士,"如此密集的会面,反映出他内心的不安"。

"GPU的技术成长已接近停滞,这是我的看法。人工智能计算机的演进,将由内存来主导。"

他的论证脉络分明:GPU要提升性能,只能增大芯片尺寸、集成更多运算单元;但GPU过热,必须在背面加装散热设备,因此无法像内存那样进行垂直堆叠。"GPU陷入了外部连接的困局。"

相比之下,从训练阶段迈向推理阶段,内存的价值正被重新评估。金正浩表示:"推理时代,关键在于能为AI注入多少数据,而决定这一能力的半导体正是内存。"

他进一步强调,AI实力的角逐终究是内存实力的比拼:"谷歌Gemini、OpenAI、Anthropic Claude,谁更胜一筹,取决于内存——这是我的论断。"

金正浩将HBM的价值提炼为两大方面。

首先是容量。随着上下文工程(context engineering)、多模态输入和Agentic AI的兴起,内存需求以逐年倍增的速度攀升,"10年将增长1000倍"。传统方法依靠缩小晶体管来扩容,但如今已触及量子力学极限,几乎无法再微缩,因此必须"向上堆叠"。

其次是带宽。金正浩比喻道:"传统内存好比8车道高速公路,HBM则是1024车道,如今已达2048车道,未来几年可能扩展至100万车道。" 通过并行通道同步传输巨量数据,方能跟上AI运算的速度要求。

HBM攻克了速度难题,但容量仍存在上限。金正浩在采访中详尽阐述了他所设想的下一技术路径——HBF(High Bandwidth Flash)。

简而言之,HBF就是将NAND闪存如同HBM一样垂直堆叠。DRAM速度迅捷但容量受限,NAND闪存容量庞大、可持久保存数据,速度虽稍逊,但在推理场景中足以应对"冷数据"的存储需求。

金正浩认为,未来HBM和HBF将形成协同并存的生态,类似城市布局:"如同有大型商场,周边分布着复式住宅、普通民居,各种类型的HBM、HBF组合在一起,构建复合体,向GPU输送数据。"

他做出了一项明确的远期预测:"当前是HBM的天下,但10年后,NAND闪存和HBF的市场需求将超越HBM。三星和SK海力士必须为HBF时代做好布局。"

他指出,目前正在研发HBF的企业包括SK海力士、闪迪、三星电子,以及日本的铠侠(Kioxia)。铠侠市值近期超越了丰田汽车,跃居日本股市首位,闪迪股价持续上扬,而三星和SK海力士则在韩国市场保持市值领先地位。

金正浩还提及了一个仍属前沿构想的方案——HBS(High Bandwidth SRAM)。

SRAM(静态随机存储器)比DRAM快约1000倍,但密度低、成本高,传统上仅用作芯片内部的小容量缓存。金正浩的设想是:将整张12英寸晶圆全部制成SRAM,再垂直堆叠12至16层,便可将容量从100GB提升至1600GB。

"这样速度骤增1000倍,容量又充足,逻辑就通顺了。"

他描绘的终极AI芯片形态是一座"100层3D大厦":"HBM、HBF、HBS各自构成多层建筑,GPU置于顶层负责散热降温,这就是未来AI计算机必然走向的3D半导体架构——这是我当前的判断。"

他同时坦诚,这条道路最大的工程障碍并非运算,而是供电与散热:"要给GPU和堆叠内存输送数千安培的电流,电力配送网络的设计将是至难的技术挑战,这也将成为企业间真正的核心竞争力。"

金正浩特别论述了HBM4带来的供需格局变迁。

以往,内存是标准化产品,厂商先行生产、客户随后选购,买方掌控定价权,库存风险由内存厂商承担,这便是"内存周期"的实质。

但从HBM4开始,由于需依据英伟达、谷歌、AMD等客户的加速器架构进行定制设计(即"定制HBM"),内存厂商必须在研发初期就获得客户的数量承诺,才会启动开发——也就是所谓的"长期协议(Long-term Agreement)"。

"AI企业极其渴求高性能HBM,所以他们排队等候。供应方开始主导定价,这是模式的根本转变。"

他还预期,未来HBM芯片将内置通信功能,实现"HBM之间彼此对话",形成类似联盟的结构:"我们自行沟通,谁对我们更有利,就分配给谁更多内存;不顺从的GPU,就不予分配。"

这进一步提升了内存厂商的系统性地位。

金正浩在采访中反复强调,全球范围内能同时量产DRAM(HBM)和NAND闪存(HBF)的企业,目前仅有三星电子和SK海力士。

"闪迪和铠侠虽然股价飙升,但只能制造HBF,无法生产HBM。三星和SK海力士掌握着引领未来最有力的工具。"

当被问及三星与SK海力士今年合计营业利润500万亿至600万亿韩元的预测是否可行,金正浩回应:"可行的。" 他补充说,他时常与两家公司的高管进行技术交流,"他们的目光愈发闪亮了。"

不过他也指出竞争压力确实存在,美光、闪迪获得了来自英伟达和谷歌的订单分流。

金正浩还将内存需求的叙事拓展至终端设备。

他预测,未来AI PC要真正实现个人AI计算,所需内存规模将使"一台PC的价格达到1000万韩元,内存价格决定PC价格"。而AI智能手机售价300万至500万韩元中,200万至300万韩元将是内存的成本。

"AI基础设施、AI模型的持续演进,需要越来越多的内存。AI PC和AI手机,是这一趋势的另一条主线。"

金正浩对AI发展方向的见解同样引人深思。他认为,随着Agentic AI(智能体AI)和Physical AI(具身AI/物理AI)的到来,内存使用量将比现今高出约1000倍。

"AI代理全天候运作,不像人类需要休息,工作负荷激增,内存需求自然随之爆发。那时不再是HBM,而是需要'超级HBM'的时代了。"

金正浩在采访末尾回顾了自己的学术历程。

他于1993年获得博士学位,研究方向为飞秒(femtosecond)级超快电信号测量,导师数年前荣获诺贝尔物理学奖。1994年他加入三星电子内存事业部,1996年返回KAIST,此后持续深耕内存与HBM基础研究约10年,才转化为商业产品。

2015年,他在一次校内会议上首次听闻"深度学习"这一术语,随即意识到AI算法与HBM架构背后运用的是同一套数学——线性代数和矩阵运算。"我在大学二年级时就特别喜欢矩阵,两边恰好用的是一样的数学——这就是运气。"

他笑称,当初研发HBM时设想的是用于电视机上让画面更生动,完全未曾料到会成为AI时代的基石:"那时候不知道,这也可以说是运气。"

觉得好看,请点“在看”