谷歌携手美满电子研发新型AI推理芯片
据两位知情人士透露,谷歌正与美满电子科技探讨合作,共同开发两款新型芯片,以提升 AI 模型的运行效能。其中一款为内存处理单元,设计用于配合谷歌的 TPU 协同工作;另一款则是专为 AI 模型打造的全新 TPU 芯片。
这一趋势反映出,智能体等商用产品对 AI 推理芯片的需求正在激增。英伟达在 3 月的 GTC 大会上推出了 LPU,该芯片基于其以 200 亿美元获得的 Groq 技术授权。
虽然谷歌此前只向美满电子购买过标准现货芯片,但此次谈判旨在开发定制化半导体芯片。这再次证明谷歌希望打破对博通的单一依赖,实现合作方多元化。
据《信息》2023 年的报道,谷歌曾考虑让美满电子取代博通,成为其数据中心网络接口芯片的供应商。
一位谷歌内部人士透露,研发新型推理芯片原本就是谷歌的计划,而英伟达发布 LPU 后,这一进程被进一步加速。由于美满电子是 Groq 第一代 LPU 的设计方,其在推理芯片设计上拥有丰富经验。
Funda AI 此前也曾报道过谷歌与美满电子就新 TPU 进行洽谈的消息。
谷歌此前曾采购过美满电子的 CXL 控制器芯片,用于管理服务器间的内存共享。基于过往的合作经历,谷歌对美满电子联合开发新芯片的能力充满信心。
知情人士称,谷歌的新内存处理单元将与 TPU 配合,根据算力和内存需求分担任务。双方计划最快于明年完成设计并交付试产。
此外,谷歌计划生产近 200 万颗内存处理单元,但由于谈判尚处初期,该数字可能调整。相比之下,摩根士丹利预计 2027 年谷歌将生产约 600 万颗 TPU。目前尚不清楚新 TPU 的设计完成时间和量产规模,但新内存处理单元可与现有 TPU 兼容。
谷歌目前的芯片均由台积电代工,新款芯片由哪家厂商生产尚未确定。
多年来,谷歌主要在自有数据中心使用 TPU 支撑搜索、YouTube 和 Gemini 模型,并只向谷歌云客户开放。但去年这一局面被打破,谷歌开始向外部客户出租 TPU,直接挑战英伟达的主导地位。目前,TPU 已获得 Anthropic、Meta 和苹果等客户的认可。
专用推理芯片的兴起,是因为 AI 企业推出了智能体等更复杂的产品,这些产品所需的算力远超传统聊天机器人。
然而,并非所有推理任务都相同。生成回复需要大量算力,而某些环节则受限于内存读写速度。针对不同任务使用不同类型的推理芯片,已成为 AI 企业提高效率、降低成本的关键策略。
例如,OpenAI 最近签署协议,向英伟达和 Groq 的竞争对手 Cerebras 采购超过 200 亿美元的推理芯片,同时也在使用其他厂商的芯片。此外,OpenAI 还在与博通联合研发自研推理芯片。
美满电子专注于数据中心的标准网络、存储和光互联芯片设计,其定制芯片业务规模正在扩大,已成为其增长最快的板块。
自 2023 年以来,谷歌一直试图摆脱对博通的依赖,因为博通收费昂贵,且随着 TPU 需求激增,费用也随之上涨。
去年,谷歌引入联发科参与 TPU 设计,但博通仍是核心合作伙伴。本月早些时候,双方签署新协议,将在 2031 年前为下一代数据中心机柜开发供应定制 TPU 和网络组件,显示出博通在谷歌芯片业务中的核心地位。
责任编辑:郭明煜
新浪财经声明:本文转载自合作媒体,旨在传递更多信息,内容仅供参考,不构成投资建议。
郑重声明:1.严禁编造、传播虚假信息;2.用户言论仅代表个人观点,与网站无关,不构成投资建议。
