安蒙预测2030年AI词元需求激增40倍 高通布局智能体时代
高通公司股价周一尾盘下跌逾7%,但CEO克里斯蒂亚诺·安蒙在Computex 2026开幕主题演讲中释放的AI增长预期,为市场提供了中长期乐观指引。安蒙预测,到2030年,AI词元生成量将从当前的317亿个/10秒跃升至约1.27万亿个/10秒,增幅近40倍。 安蒙在演讲中明确将2026年定义为"智能体之年",标志着AI从被动响应指令的工具,进化为能够自主规划、推理和执行任务的智能伙伴。安蒙指出:"今天的设备并不是为智能体设计的。现有设备大多是围绕'用户主动操作'设计的,当使用者与AI智能体同时操作同一台
AI账单压力与组织变革同步发酵
乾昌AI商业内参2026-05-30 · 主理人老张栏目导语5月30日这盘棋很直白:一边是企业拼命压AI token账单,一边是Meta、字节把「可被SOP化」的岗位直接砍掉。今天只聊能落到利润表和组织图上的事。Glean年收破3亿美元:企业终于愿意为「少烧Token」买单AI生产力工具核心资讯企业搜索独角兽Glean宣布年化收入达3亿美元,15个月从1亿翻三倍。CEO Arvind Jain强调其「上下文图谱」能对接企业内部系统,让AI少做无效检索、少耗Token。Google、微软、OpenAI、An
AI 日报:美光跻身万亿俱乐部,高通联手指尖巨头,基建热潮再起
1、美光市值首破万亿大关,AI 存储领域成资本新宠周二美光科技股价飙升,市值历史性地跨越1万亿美元门槛。据路透社报道,该股盘中涨幅约18%,主要驱动力源于AI数据中心对高带宽内存及存储需求的激增。美光方面透露,其2026年的HBM产能已全部售罄,且下一代HBM4产品已步入量产流程。AI 算力绝非仅靠 GPU 支撑。大模型的训练与推理极度依赖数据吞吐能力,HBM、高速存储、互联技术及服务器系统正演变为 AI 基建的关键瓶颈。美光跻身万亿俱乐部,折射出资本市场不再单纯视英伟达为 AI 硬件唯一核心,而是开始重
Cerebras Systems冲刺纳斯达克,AI推理芯片引爆百亿估值
受益于AI芯片市场的持续火热,Cerebras Systems即将在纳斯达克挂牌上市(26348.3479, 101.27, 0.39%),创下今年全球最大IPO纪录。据悉,由于机构认购异常火爆,该公司已将IPO定价区间从每股115-125美元大幅调升至150-160美元,发行量也增至3000万股,以最高价计募资规模可达48亿美元,总市值约350亿美元。 巨头加持构筑成长基石 Cerebras深耕AI推理芯片领域,其CS-3晶圆级引擎在运算速度和内存带宽方面显著优于传统GPU。年内接连斩获两大顶级客户:亚
高通AI200/AI250双芯出击:推理战场还能稳住英伟达吗?
随着全球AI竞争的重心从“模型训练”逐步转向“推理效率”,数据中心芯片的较量也正在酝酿新的版图变动。2025年10月28日,高通正式亮出AI200与AI250两款面向数据中心推理场景的全新芯片,并同步发布配套加速卡与机架式系统。此次行动并非试水,而是借助移动NPU的长期积累实现“精准打击”,直指由英伟达主导的AI推理核心区域。高通希望凭借低功耗、大内存以及更优TCO,重新定义生成式AI落地时的成本与性能权衡。与英伟达GPU往往采取“训练+推理一并覆盖”的策略不同,高通这次把资源集中在AI推理专用赛道上。两
英伟达推理芯片提前出货:千亿链条新机遇
引言2026 年 4 月,供应链端传出重要进展:英伟达在完成收购 Groq 后推出的首款推理专用芯片 Groq 3 LPX,将原本计划在年底才启动的发货安排,提前到第三季度展开。预计全年交付量可达 150 万颗,同时配套的 LPX 机架交付规模超过 6000 台。此次调整并不只是简单的产能加快,更像是 AI 产业从 “训练驱动” 转向 “推理释放”的关键拐点。目前全球 AI 算力需求的结构正在重塑:到 2026 年,推理算力需求预计将达到训练算力的 4-5 倍;在中国市场,这一比例可进一步放大至 8 倍。
国产AI算力链景气上行
一、核心:两大趋势锁定主线,行业景气度持续抬升1. 国产AI芯片加速崛起:国内AI芯片市场份额持续扩大,本土供应链关键环节的竞争力不断增强,国产替代进程稳步推进;2. 超节点放量可期:国产超节点相关技术已基本成熟,正迈向批量交付阶段,或将成为驱动行业演进的关键主轴。二、四大核心逻辑:支撑算力链长期走强逻辑1:AI需求全面释放,算力消耗与商业化同步突破AI需求的加速增长,是算力链保持向好的根本动力,主要体现在以下三方面:✅ Token消耗显著上扬:豆包大模型日均Token用量突破120万亿,短短3个月实现翻
芯片初创瞄准AI内存瓶颈突破路径
超大规模的人工智能模型让服务器负荷剧增,高端芯片也更容易出现闲置。谷歌以及元宇宙领域(Meta)的多位资深从业者表示,他们已经摸索出可行的破解思路。 内容摘要 Majestic Labs AI 打造了新一代服务器系统“普罗米修斯”,核心目标是在运行超大 AI 模型时,打破由内存容量与带宽带来的性能瓶颈。 由谷歌(Alphabet 旗下)与 Meta 过往关键高管组成的团队,研发了一套新的服务器架构,意在应对当前 AI 模型规模持续膨胀、技术复杂度不断上升所带来的部署与运行难题。 Majestic Labs
谷歌推出新一代AI芯片 训练推理分离对抗英伟达
在多年研发可兼顾人工智能模型训练与推理工作的芯片之后,谷歌正将这两项任务拆分至不同处理器,这是其在AI硬件领域挑战英伟达的最新策略。 谷歌周三宣布,将对第八代张量处理单元进行这一调整,两款芯片均将于今年晚些时候上市。 谷歌高级副总裁兼人工智能与基础设施首席技术官阿明·瓦赫达特在博客文章中指出:“随着AI智能体的兴起,我们认为,针对训练与部署需求进行专业化定制的芯片,将推动整个行业发展。” 今年3月,英伟达曾宣传其即将推出的芯片产品,借助以200亿美元收购芯片初创企业Groq获得的技术,该芯片可让模型快速响
谷歌携手美满电子研发新型AI推理芯片
据两位知情人士透露,谷歌正与美满电子科技探讨合作,共同开发两款新型芯片,以提升 AI 模型的运行效能。其中一款为内存处理单元,设计用于配合谷歌的 TPU 协同工作;另一款则是专为 AI 模型打造的全新 TPU 芯片。 这一趋势反映出,智能体等商用产品对 AI 推理芯片的需求正在激增。英伟达在 3 月的 GTC 大会上推出了 LPU,该芯片基于其以 200 亿美元获得的 Groq 技术授权。 虽然谷歌此前只向美满电子购买过标准现货芯片,但此次谈判旨在开发定制化半导体芯片。这再次证明谷歌希望打破对博通的单一依
AI创投风云榜 | 具身智能赛道狂揽百亿,「智慧核心」成资本新宠
核心要点AI领域投融资动态(2026年4月11日至4月17日)一、开篇13起重大融资事件深度剖析,全面覆盖具身智能、世界模型、AI编程、云基础设施、推理芯片、AI视频等全链条赛道二、本周融资全景图它石智航4.55亿美元创下国内具身智能单轮募资新高,赛道焦点从「硬件比拼」转向「智能核心」深度较量,DeepSeek启动外部融资引发市场震动1. 它石智航 (TARS)2. 极佳视界3. Factory4、Railway5. 行云集成电路6. 智象未来 HiDream.ai7. Sand.ai8. 享刻智能9.
国产AI芯片实力几何?谁在撼动英伟达
📅 2026年行业观察 · 模仿就是妥协出品大家中午好,前面的文章我们聊过AI产业链里的光模块、液冷服务器和存储芯片,这些都属于AI基础设施层。今天,我们把视角转向AI算力链条中最核心的一环:AI芯片。之前内容感兴趣的朋友也可以回看相关链接,感谢大家一直以来的支持与关注!液冷:AI浪潮中的“散热方案”还是“增长引擎”?AI算力的“主干道”:共封装光学(CPO)谷歌论文搅动存储赛道,2026年存储芯片行业究竟怎么了?如果把光模块看作负责信息传递,液冷看作负责控温,那么AI芯片才是真正承担计算任务的那个“大脑