AI推理提速:算力突围战开启,技术变革惠及民生
深夜的机房里,服务器风扇的轰鸣声中,工程师注视着屏幕上迟缓移动的进度条。一段代码,一个模型,一次推理,等待的时间从秒级拉长到分钟级。这并非科幻场景,而是每一位AI开发者都曾体会的焦虑时刻。算力瓶颈宛如一道无形的屏障。屏障这边,是日新月异的模型架构与算法革新;屏障那边,则是现实应用对即时响应的强烈渴求。当大模型参数突破千亿,当多模态任务成为常态,推理效率便成了决定AI能否真正落地的核心要素。推理优化的本质,实则是一场与时间、与资源的较量。早期的推理优化宛如一场蛮力角逐。通过堆叠更多GPU、增加内存带宽,试图
AI推理成本断崖式下跌:企业应用迎来免费时代
开篇:一场正在进行的颠覆2024年,企业使用AI推理处理每1000个token需支付12美元。 2025年,这一费用降至1.2美元。 2026年中旬,Anthropic CEO达里奥·阿姆斯特萨做出预测:"2027年,AI推理费用将趋近于零。"这并非空想主义者的幻想。这正是当下正在发生的现实。本文将深入探讨三个核心问题:AI推理费用为何急剧下滑?哪些力量在主导这场"拼多多"式的降价风暴?推理免费时代降临后,世界格局将如何重塑?你或许熟悉智能手机的价格演变:2007年,初代i
英国AI推理芯片开发商Fractile获2.2亿美元融资,聚焦专用芯片研发
总部位于英国的AI推理芯片开发商Fractile成功获得2.2亿美元B轮融资,由Factorial Funds、Accel以及Founders Fund联合注资。 该公司由牛津大学背景的工程师Walter Goodwin于2022年创办,专注于人工智能推理专用芯片的研制。推理是AI模型处理用户查询请求时的核心计算环节。
AMD发布vLLM-ATOM插件提升AI推理效率
IT之家 5 月 12 日消息,科技媒体 Wccftech 昨日(5 月 11 日)发布博文,报道称 AMD 推出 vLLM-ATOM 插件,在不改动现有 vLLM 命令、API 和工作流的前提下,提升 DeepSeek-R1、Kimi-K2 和 gpt-oss-120B 等大语言模型推理性能。 IT之家注:vLLM 是面向大语言模型部署的开源推理框架,重点优化高并发服务场景下的吞吐和显存利用率。与一般“单次调用”推理工具不同,它更强调请求调度、KV 缓存和连续批处理,适合企业把模型做成长期在线服务。 A
GF预测:AMD、英特尔、高通将迎服务器CPU增长红利
芯片制造企业GlobalFoundries近期指出,由于AI推理及智能体应用需求激增,服务器CPU市场正步入结构性增长的“超级周期”,AMD(464.57, 9.38, 2.06%)、英特尔(127.0999, 2.18, 1.75%)和高通(235.56, 16.47, 7.52%)将成为主要受益方。 以往以GPU为核心的AI训练阶段,GPU与CPU使用比例约为8:1。但随着AI应用向推理和智能体方向发展,该比例已从8:1下降至4:1,未来可能接近1:1。CPU在数据调度、内存管理及系统协同中的作用显著
AI推理时代下的服务器CPU市场机遇与挑战
当前全球服务器处理器市场正因AI推理与智能体AI技术进入历史性超级发展阶段;作为x86架构核心供应商,英特尔正经历需求激增、全线缺货、价格持续攀升、产能全面拉紧的态势。短期内(6-12个月)量价齐升格局基本确定,中长期则面临市场份额逐步流失、技术路线调整、AMD/ARM双向竞争等结构性约束。一、核心驱动:AI工作负载迁移,处理器角色全面重估此轮景气并非传统算力周期,而是AI技术栈分工重构所带来的刚性需求重新评估。1.从“算力配角”到“控制核心”AI已从大规模模型训练转向推理部署与智能体执行阶段,CPU不再
AI推理新王现身:整片晶圆造芯,OpenAI豪掷200亿,英伟达受冲击?
昨夜观看了《荒野心智观察》B站视频,内容极具价值,但技术细节较为密集。现将重点梳理如下:大家好。AI领域近日传来重磅消息:一家名为Cerebras的芯片企业,几乎已晋升为OpenAI的“专属”推理芯片供应商。OpenAI不仅向其抛出200亿美元的大单,其高管团队更亲自注资,实现深度捆绑。你或许会疑惑:英伟达的GPU不是所向披靡吗?OpenAI为何要“另辟蹊径”?答案仅四个字:AI推理。今日,我们用通俗语言,剖析这场正在上演的“算力博弈”。---一、AI下半场:从“死记硬背”转向“现场作答”AI能力可分为两
5月6日美股成交榜:英特尔大涨近13%,机构上调目标价
周二美股成交额位居首位的是美光(640.2, 63.75, 11.06%),股价上涨11.10%,并刷新历史高点,成交额达389.69亿美元,市值突破7000亿美元。今年以来,美光累计涨幅已超120%。当日存储芯片相关个股表现强势,美光科、闪迪(1406.32, 150.46, 11.98%)、希捷(771.01, 32.47, 4.40%)、西部数据(465.26, 22.90, 5.18%)等多只股票均创出新高。 在消息层面,存储芯片龙头美光科技董事长兼首席执行官Sanjay Mehrotra在媒体采
英特尔投资SambaNova获反垄断放行 推进AI推理布局
英特尔(95.78,-3.84,-3.85%)在上周五表示,美国反垄断监管部门已完成对其投资AI芯片初创企业SambaNova的审查,双方因此得以进一步深化合作,关键的监管环节被打通。受该消息影响,英特尔当日股价上涨近4.5%。 根据监管公告,包含美国联邦贸易委员会在内的相关机构已批准本次交易。英特尔今年2月向SambaNova投资3500万美元,并结合其他融资安排,使其持股比例从去年的6.8%提高到8.2%。同时,英特尔还计划再追加1500万美元投资,以持续加深双方协作。 SambaNova聚焦AI推理
AI推理数据首超训练数据,产业迎来应用新纪元
🧠 AI产业的里程碑时刻🧠AI产业的里程碑时刻AI推理数据量首次超越训练数据量:意味着AI从"学习"迈向"应用"新时代 未来科技观察 | 2026年5月未来科技观察 | 2026年5月引言:2026年,中国人工智能领域出现了一个具有深远意义却易被忽略的转变——推理数据量历史性地超过了训练数据量。这不仅仅是数字的变化,它象征着AI产业从"模型构建"转向"模型应用"的关键转折! 一、一个里程碑式的转折 依据国家数据局公布的官方数据: 101.34 EB 推理数据量 ✅ 官方权威数据 98.14 EB 训练数据
AI推理时代:云服务商的命脉是电力与存储,后者需求将无限膨胀
台湾存储芯片巨头群联电子首席执行官潘健成近日受访时提出,在人工智能推理时代,云服务提供商若想实现稳定收益,必须确保电力与存储资源的充足供给,其中存储需求的增长将是"无边无际、永不饱和"的。1.推理时代的盈利模型:电能投入 → 数据产出 → 存储转化收益潘健成分析称,云服务商用万亿美金构建的AI应用,其盈利来源于用户付费使用的推理服务。推理过程消耗电能,产生数据;而数据唯有保存才能创造价值,"若无存储空间,便无收入来源"。故而,收益与存储容量呈正相关关系,收益越高所需存储越多,这种需求是无限且不受经济周期影
闪迪业绩飙升:AI存储新纪元开启
本次闪迪发布的财务报告,我认为不仅仅是“超出预期”那么简单,它更是一个至关重要的行业风向标。我的解读可以概括为三点:首先,业绩的爆发是真实存在的。第三季度的营收、利润以及毛利率均全面超越了市场预期,并且第四季度的业绩指引也得到了大幅上调。其中,单季非通用会计准则净利润已逼近50亿美元。其次,商业模式的转变比单季利润数字更为关键。公司签署了5份为期多年的NBM协议,锁定了420亿美元的最低合同收入,并获得了超过110亿美元的财务保障。更重要的是,到2027财年,超过三分之一的比特(bit)已被锁定。这些因素
AI推理与Agent时代产业链龙头全景梳理
AI推理与Agent时代产业链龙头全景梳理紧扣文章核心脉络,融合AI产业链底层逻辑、市场潜在机会、需求演变及供给刚性约束四大视角,锁定AI产业由训练向推理及多智能体主导的范式转移主线,梳理出产业链领先企业的三大梯队,深入挖掘在服务器底层架构重塑阶段,CPU、内存接口、整机系统等关键环节所蕴含的业绩爆发力及估值修复契机。一、底层核心逻辑四大维度的深度剖析1. AI产业链底层逻辑AI行业正处于底层范式转换期:从训练期的单一GPU驱动,演进至推理与多智能体时期的CPU与GPU并驾齐驱,服务器底座的价值权重正经历
AI每日观察 | 2026年5月1日
要点:数字中国峰会透露,2025 年全国 AI 推理所对应的数据量(101.34 EB)首次超过训练数据量,标志着 AI 正式迈入“应用与执行”阶段。补充:数据总规模达到 199.48 EB,同比增长 42.86%。这也意味着建设底座的重点将从“打造大模型”逐步转向“调用并落地大模型”。影响:企业需要调整 IT 架构设计,推理芯片与边缘算力的需求有望快速放大。要点:《杭州市促进具身智能机器人产业发展条例》自今日起正式实施,为机器人在道路与工厂环境的使用提供更明确的法律依据。补充:作为全国首部相关地方性法规
单台700万仍供不应求!英伟达B300服务器在华价格狂飙
据快科技5月1日消息,NVIDIA B300 AI服务器在中国大陆市场的实际成交价格已攀升至每台约700万元人民币,折合近100万美元,相比去年年底约400万元的价位几乎上涨了一倍。 作为对比,搭载8块B300 GPU的同型号服务器在美国市场的售价大约为55万美元,较去年底的50万美元仅有小幅上扬。中国市场的高昂溢价使其价格几乎翻倍。 价格的急剧上涨已迫使部分预算有限的AI企业调整策略,从直接购买转向租赁模式。据了解,B300服务器一年期租赁合约的月租金已上涨至19万元人民币,并且仍需排队等待设备资源。