推理芯片_标签-酷阅新闻

谷歌推Frozen v2芯片，AI算力效率提升十倍

两名知情人士透露，谷歌正在开发一款全新服务器芯片，该芯片将 Gemini 大模型的底层架构直接固化在硅基硬件中，能够极大提升谷歌向用户提供 AI 服务的运行效率。这款内部代号为 Frozen v2（固化二代）的芯片，旨在缓解谷歌当前严峻的 AI 算力缺口。算力不足不仅引发了谷歌内部各部门的矛盾，还导致谷歌云不得不回绝大量外部客户的算力采购订单。参与该芯片研发的工程师测算，按单位功耗可处理的 Token 数量（AI 算力核心计量指标）计算，该芯片正式落地后，其能效可达谷歌现有最新一代自研 AI 张量处理器

2026-07-21 00:23:39 | 4 阅读

4亿美元推理芯片抵押融资落地，AI投资风向转变

AI推理云初创企业General Compute近日从科技投资机构Upper90处成功获取4亿美元贷款。这或许标志着全球首笔以专用推理芯片作为抵押物的融资案例——此类芯片旨在高效运行已训练完成的AI模型，而非用于构建模型的高成本训练芯片。本轮融资反映了市场对AI工具及Token价格波动的最新应对策略，投资者正纷纷转向基于开源模型的基础设施，其运营成本远低于前沿实验室最新推出的大语言模型。 General Compute由CEO Finn Puklowski和CTO Jason Goodison联合创立，

2026-07-18 01:18:41 | 10 阅读

AI自研芯片时代来临：九个月造芯颠覆行业

Michael | 五源资本投资人2026年6月，OpenAI与博通联合发布了一款名为Jalapeño的推理芯片。其具体参数未公开，但两点突破更引人注目：第一，这颗芯片完全由OpenAI基于自身模型架构、未来路线图与推理体系从零定义，博通负责硅片实现——OpenAI不再满足于采购通用算力，而是追求量身定制的硬件。第二，这款逼近光罩极限的先进制程芯片，从立项到流片仅耗时九个月，据双方称，创下高性能芯片开发速度的历史纪录。缩短周期的关键助力，正是OpenAI自研的AI模型。AI芯片的上半场已告一段落，英伟达是

2026-07-13 12:35:45 | 18 阅读

AI产业观察：竞争重心转向电力、推理芯片及合规治理

观物如实-拒绝碎片化认知。本文基于2026年7月9日前的公开资料梳理，重点探讨AI产业技术迭代、企业应用、成本控制及合规体系建设。本文仅供行业参考，不作为投资、法律或合规建议。截至当前，AI产业已从单纯的“模型能力比拼”深化为“基础设施、终端入口及治理体系”的全方位角逐。在硬件与基础设施层面，Meta宣布在加拿大阿尔伯塔省Sturgeon County建设1GW规模数据中心，涵盖电力、基建及冷却方案。这表明大型AI基建已超越单纯采购GPU，演变为电力供应、冷却系统、本地配套及长期运维的综合工程。此外，Pe

2026-07-09 10:34:07 | 21 阅读

资本加注AI芯片挑战者，SambaNova跻身百亿美元独角兽

核心要点一家 AI 芯片初创企业完成 10 亿美元新一轮融资，资本持续涌入各类意图挑战英伟达的芯片厂商。本轮融资由泛大西洋投资集团领投，塞利格曼风投、普信集团、资本集团跟投，融资完成后 SambaNova 整体估值达到 110 亿美元。该公司于周三官宣本次融资，今年早些时候它已完成超 3.5 亿美元融资，投资方包含英特尔(109.35, -1.04, -0.94%)，双方同期还达成战略合作。公司联合创始人兼首席执行官罗德里戈・梁在巴黎举办的 Raise AI 峰会上接受采访时表示：“推理市场彻底

2026-07-08 21:41:58 | 14 阅读

获三星投资的AI芯片企业Rebellions，CEO定档明年韩国IPO

核心摘要 Rebellions 首席执行官独家透露，借着全球资本对 AI 芯片领域的狂热追捧，公司规划在明年第一季度或第二季度于韩国进行首次公开募股。 Rebellions 首席执行官朴成铉透露，与韩国创业板 KOSDAQ 相比，公司更倾向于登陆韩国综合股价主板 KOSPI。他在周三接受采访时表示：“我们已经实现了稳定的实际收入，因此正联合承销商摩根大通(339.22, 1.50, 0.44%)和三星证券筹备上市事宜。” 他补充说：“我们的投资者更看好韩国市场，特别是 KOSPI 主板。我们深度参与韩国

2026-07-08 21:12:03 | 33 阅读

智谱AI自研芯片计划曝光：大模型厂商掀起造芯潮

7月7日，美国媒体The Information披露，智谱正在评估自研定制AI芯片项目，目前仅处于早期接洽阶段。多位内部人士透露，智谱已主动联系本土芯片设计企业，计划联合开发适配GLM系列模型的专用ASIC芯片，全程采用国内晶圆厂进行流片，并不打算从零开始建立完整的芯片团队。此次涉足芯片领域，主要面临两大现实挑战：首先，GLM-5.2上线后调用量急剧攀升，算力缺口直接制约业务扩展，代码、多模态套餐长期处于供不应求状态，通用GPU适配效率低下、推理成本始终高企。其次，智谱已被列入美国实体清单，高端英伟达显卡

2026-07-08 15:45:50 | 23 阅读

DeepSeek估值近4000亿！自主研发AI推理芯片引关注

据内部人士透露，中国人工智能企业DeepSeek正在开发自家人工智能芯片，此举有望减少对海外芯片的依赖。此前该公司一直依靠这些芯片来训练和运行其全球热门的人工智能模型。知情人士指出，该芯片的设计目标是推理阶段（即人工智能计算中已训练模型为用户提供答案的环节），而非训练新模型。若研发成功，DeepSeek进入半导体研发领域将标志着这家中国人工智能龙头企业的一次重大战略转变。“英伟达在中国的市场份额为零，而且将持续保持零增长。除非DeepSeek能够获得先进的制造工艺，否则它几乎没有可能在国际市场销售芯片，”

2026-07-08 09:15:47 | 18 阅读

AI跨界造芯：OpenAI首款推理芯片Jalapeño正式亮相

从架构定义到流片仅用9个月——这是高性能芯片领域最快的ASIC开发周期。完成这一壮举的不是传统芯片厂商，而是人工智能公司OpenAI。2026年6月24日，OpenAI携手博通推出了首款定制推理芯片Jalapeño，性能可与英伟达Blackwell和谷歌TPU媲美，推理成本预计降低约50%。AI设计芯片，芯片驱动AI——一个自我加速的闭环正在形成。这股潮流会波及国内吗？关键观察要点① 芯片规格与合作模式。 Jalapeño是推理专用ASIC（不涵盖训练），采用台积电3nm工艺，9个月内完成流片。OpenA

2026-06-30 12:55:24 | 14 阅读

百度旗下昆仑芯拟港股上市要求认购方加码采购芯片

在国内，芯片厂商似乎为自家半导体产品开辟了一类新型买家：IPO 认购方。据一位参与该公司近期投资者推介会的人士、以及另一位了解昆仑芯上市方案的知情人士介绍，百度(104.22, 0.23, 0.22%)控股的AI芯片企业昆仑芯科技拟赴港IPO，期望估值达到500亿美元。两名参与路演的人士指出，在争取新股认购投资方的过程中，昆仑芯会优先考虑承诺采购自家芯片的机构。依托深度调研整理相关知情人士透露，其中不乏带有各地政府背景的投资基金（这类基金被引导投向人工智能、半导体领域），这些投资方被要求采购的芯片总

2026-06-29 19:14:59 | 22 阅读

OpenAI九个月造芯：AI自驱设计刷新半导体纪录

传统芯片研发，从绘制草图到交付代工厂，往往耗时两至三年。OpenAI仅用九个月便完成。大幅压缩这一周期的关键，正是ChatGPT——它参与设计的芯片，最终将由它自身驱动运行。2026年6月24日，OpenAI携手博通正式推出名为Jalapeño（哈拉贝诺辣椒）的芯片。这不仅是OpenAI首款自主研发的AI推理芯片，更标志着“AI参与设计其运行硬件”首次从概念走向实物。首先需厘清一个常被忽视的差异。大语言模型的运作分为两大阶段：训练与推理。训练属一次性任务——模型吞噬海量文本与数据，习得“表达”能力，此过程

2026-06-27 07:00:25 | 25 阅读

AI芯片重塑计算格局：OpenAI造芯与IBM探索0.7纳米技术

AI芯片重塑计算格局：OpenAI造芯与IBM探索0.7纳米技术两条似乎毫不相干的科技资讯，实际上都在指向同一个核心问题：计算成本已成为AI领域最棘手的挑战。2026年6月26日原创无版权风险配图：面向AI推理负载的通用芯片场景，不含真实商标。但这并不代表英伟达的统治地位已遭遇实质威胁。OpenAI自主研发推理芯片，距离摆脱对英伟达的依赖还有很长一段路，将两者简单对立起来是一种误解。推理与训练、软件生态及数据中心部署固然属于不同赛道，但这至少说明：AI公司已不再满足于仅仅采购现成计算芯片。随着模型规模扩张

2026-06-27 00:26:28 | 9 阅读

AI产业日报：算力成本、智能体效能与安全治理成竞争新焦点

洞察真相-摒弃零散信息。本文依据公开信息编撰，重点关注AI行业技术发展、商业落地、效能开销与规范建设。本文仅供行业参考，不作为投资、法律及合规建议。2026年6月26日，AI领域的发展脉络愈发明确：尽管模型性能持续突破，但左右企业应用步伐的核心要素，已变成推理开销、智能体流转效能、具身模型实用度及安全合规水平。在硬件、算力与基础设施层面，OpenAI携手Broadcom于6月24日揭晓了LLM推理专用芯片Jalapeno。OpenAI官方透露，此款芯片系专为LLM推理量身打造的加速器，其工程样品已在实验室

2026-06-26 13:12:38 | 17 阅读

OpenAI首颗自研芯片问世,代号Jalapeño,9个月完成流片创行业纪录

2026年6月24日夜间，OpenAI正式揭晓旗下首款自主研发的AI推理芯片，命名为Jalapeño——意为西班牙语中的“墨西哥辣椒”。该芯片从立项到流片仅用时9个月，刷新了高性能先进半导体领域ASIC研发的最快纪录。更引人注目的是——推动其设计加速的，正是OpenAI自身的AI系统。AI设计芯片，芯片运行AI，更强的AI将设计下一代芯片。这一闭环由此形成。Jalapeño是墨西哥辣椒中辣度较低的品种之一。OpenAI以此命名首款芯片，暗示深意：这只是起步，后续还有更激进的版本。该芯片的官方定位为“Int

2026-06-25 23:33:27 | 20 阅读

AI收费时代启幕：豆包、微信与OpenAI的商业化三重奏

从DeepSeek击穿Token定价，到算力终局归于多角度探讨能源，再到人形机器人被寄予厚望——这条叙事线兜兜转转，最终落到一个最本质的追问：AI如何实现盈利。答案在同一周内集中浮现。6月20日，微信悄然灰度测试小微AI助手。6月24日，豆包专业版正式开启收费模式。同日，OpenAI携手博通推出首款定制化AI推理芯片Jalapeño。三条消息，源自三家巨头，横跨三大领域，却默契地汇聚于同一时间节点。这绝非偶然。AI商业化并非单点突破，而是三端齐发——前端变现、中端抢占入口、底层削减成本。豆包破解"谁来付费

2026-06-25 22:33:00 | 23 阅读