推理成本_标签-酷阅新闻

Kimi K3爆火致算力告急，新用户订阅暂停

界面新闻记者 | 查沁君界面新闻编辑 | 文姝琪因需求激增，Kimi K3发布不足一周，月之暗面便紧急暂停新用户注册。 7月19日晚，月之暗面宣布，受算力资源限制，暂时关闭新用户订阅通道，优先保障现有用户的稳定服务。 7月20日，月之暗面向界面新闻回应称，此次调整仅限新用户接入，老用户权益不受影响，原有套餐继续有效，自动续费功能正常运行。针对此前手动关闭自动续费的老用户，公司将逐步恢复续订选项，套餐升级功能也将陆续开放；新套餐因算力不足暂未上线，具体恢复时间尚未公布。从官方表态看，此举实为在有限资

2026-07-21 02:36:05 | 5 阅读

游戏AI崛起：AI应用并非消亡而是转型

过去四年，AI领域经历了剧烈波动。模型企业的市值和技术不断突破新高，投资焦点逐渐转移到世界模型和具身智能。但与此同时，早期市场对AI应用的投资已跌至低谷，甚至出现了“应用已死”的说法。这到底是行业陷入狂热，还是黎明前的黑暗？游戏从业者又该如何识别并抓住机遇？“应用已死”背后的结构性盲区“应用已死”这一论断的核心逻辑在于，模型能力的无限扩张正在不断侵蚀应用层的空间。早期资本也随之转向更前沿的世界模型和具身智能等方向。然而，深入分析会发现，这一论断存在多个结构性盲区。首先，并非所有应用都陷入困境。尽管国内年经

2026-07-20 13:19:20 | 7 阅读

Amplitude定于8月5日公布二季度业绩

Amplitude今日披露，计划于2026年8月5日美股收盘后发布2026年第二季度的财务报告。届时，公司将举办视频网络直播，时间定在当天太平洋时间下午2：00，旨在分享第二季度财务数据，并展望第三季度及2026全年的业绩前景。该财报的发布引发了市场的强烈关注。作为一家AI分析平台服务商，Amplitude已协助超过4700家企业（涵盖Atlassian、Burger King等知名客户）实现了产品和数字体验的优化。截至2026年3月31日的第一季度，公司录得营收9349万美元，同比增幅为17%。年度

2026-07-16 07:20:28 | 12 阅读

AI企业盈利困局：每笔API交易背后的烧钱真相

▌ 前言2026年，OpenAI年收入突破400亿美元大关，却仍未实现盈利。Anthropic年度烧钱超过50亿美元，估值600亿却连毛利率都秘而不宣。Mistral自称欧洲最强开源模型，收入却不足1亿欧元。AI企业究竟能否盈利？这个问题远比表面看起来复杂。AI企业的成本结构与传统的软件公司截然不同——每一笔API调用背后，都在消耗实实在在的GPU算力、电力以及冷却资源。本文深入剖析AI企业的单位经济模型：收入来源何处、资金消耗在哪些环节、究竟需要多少付费用户才能覆盖成本。▲ API定价趋势图：大模型价格

2026-07-12 12:01:13 | 14 阅读

AI浪潮背后：算力、能源与资本投入成产业决胜关键

算力角逐模型能力的每一次突破，背后都是芯片、服务器、机房、电力与现金流的协同作战。最近围绕 NVIDIAAI 加速芯片新一代 GPU以及数据中心扩容的报道不断涌现市场关注的并非某家企业的股价而是 AI 产业究竟需要多少算力谁能提供成本能否降低AI 的应用大规模落地不仅取决于软件层面的创新还取决于算力供给是否充足推理成本是否降低企业能否承受长期使用的支出企业推进 AI 项目时必须把成本模型梳理清晰训练开销推理开销调用规模峰值负载私有化部署云端服务之间的权衡都将决定商业模式能否走通深度解读：算力成本决定 AI

2026-07-09 19:58:28 | 15 阅读

AI算力价格雪崩：次贷危机预警，三大巨头抢滩IPO

H100租赁费用，从每小时8美元骤降至2美元。企业账单瞬间膨胀十余倍，私人信贷渠道也明显收紧。7月4日深夜，财经博主@FinanceLancelot 发布的一段研判，将整个AI行业置于风口浪尖：「AI算力价格正在彻底崩盘。」该推文发布24小时内浏览量突破24万、获1500次点赞，评论区争论激烈。有人欢欣鼓舞，称这是"价格回归理性"的开端；也有人反驳，认为旧显卡贬值不代表AI需求终结。但无人能否认，那张断崖式下跌的曲线图，确实令人触目惊心。以下是@FinanceLancelot 的原声表述：

2026-07-08 05:04:23 | 13 阅读

AI成本革命：ASIC芯片崭露头角

上次讨论AI成本降低，提到了两个要点。AI自身在变得更加经济，AI正推动全行业成本下降。最后抛出一个观点：涨价只是信号，降本才是最终目标。果然，验证来得比预期更快。OpenAI最近公布了一项数据。o4-mini的推理开支，相较前代直接减少了10倍。10倍意味着什么？以往你执行一次推理花费10元，现在只需1元。以往运行100万次花100万，如今仅需10万。这不是微调级别的改进。而是彻底改变了竞争规则。你自然会问：如何实现的？两条路径。一条路径是软件。多Token预测加上底层深度优化，服务器效率被推至极限。好

2026-07-05 02:30:57 | 15 阅读

AI硬件热潮退去？四大信号揭示行业转向

最近观察到几个值得注意的动向。不是崩溃，而是热度在回落。信号一：GPU租赁价格持续下滑H100每小时租赁价从高位稳步下降。核心原因并非需求消失，而是供给端集中释放——AWS、Azure、GCP都在大规模扩充GPU集群。过去一卡难求，如今云厂商反而希望你多租。买方市场正逐步形成。信号二：模型推理成本快速降低本周Anthropic推出Sonnet 5，价格比旗舰Opus 4.8低40%。Google的Nano Banana 2相较上代Pro便宜约50%。头部AI企业集体下调价格，说明推理成本已不再是瓶颈，竞争

2026-07-04 14:16:49 | 61 阅读

OpenAI揭秘降本秘籍，推理成本减半

据知情人士透露，本月早些时候OpenAI工程师向部分内部员工披露，通过一系列新技术的优化，他们找到了一种能让模型推理运行成本降低一半以上的方案。工程师将这套新技术用于未注册免费/付费账号的访客访问ChatGPT场景后，峰值时段所需的英伟达显卡算力规模一度仅需几百块，这一数字低得超乎预期。（当然，OpenAI针对这类匿名访客设置了调用频次限制，该群体的ChatGPT整体使用量并不算高。）目前OpenAI并未公开本次效率提升的具体技术细节，业内推测常用优化手段包含：模型量化、键值缓存（让模型记忆过往计算信

2026-07-01 02:00:07 | 28 阅读

AI亲手打造算力基石：Jalapeño芯片背后的范式转变

AI 曾主要用于辅助写代码、生成内容与处理任务。如今，OpenAI 与 Broadcom 联合推出的 Jalapeño 芯片，标志着这一进程迈出了关键一步：AI 开始直接参与设计自身运行所需的硬件。本文从 Jalapeño 仅用 9 个月完成 tape-out 的突破说起，揭示“AI 设计 AI 芯片”并非空谈，而是 AI 竞争从模型与产品，深入至芯片、推理成本与数据中心的明确信号。过去几年，人们常问：AI 会重塑软件开发吗？如今答案已清晰可见。写代码、修复 Bug、自动化测试、生成文档，AI 已深度融入

2026-06-28 21:04:31 | 16 阅读

AI 自研芯片开启万亿级递归博弈

9 个月。这是 OpenAI 从零打造首颗自研 AI 推理芯片，代号"墨西哥辣椒"（Jalapeño）所耗费的时长。该芯片由 OpenAI 设计架构，博通负责工程落地，采用台积电 3 纳米工艺制造。博通 CEO 陈福阳表示，这款芯片"能效比与英伟达 Blackwell、谷歌 TPU 处于同一水平"。OpenAI 则称，这将使其在 ChatGPT、Codex 及 API 上的推理成本直接降低 50%。造出一颗芯片并不罕见。罕见的是其设计过程——完全由 OpenAI 自家的 A

2026-06-28 12:10:30 | 22 阅读

AI 表面是软件，实则是硬件博弈

很多人以为，AI 是最轻的生意。没有门店，没有库存，没有厂房。用户看到的只是一个输入框：问一句，答一段。它不像造车，要有生产线。不像炼钢，要有高炉。不像电商，要有仓库和物流。AI 看起来更像一种漂浮在云端的软件能力。但最近几条新闻放在一起看，会发现一个变化：OpenAI 与 Broadcom 的自研推理芯片 Jalapeño 相关报道，说明模型公司开始向推理芯片和全栈基础设施策略下沉。Qualcomm 与 Meta 的数据中心 CPU / 下一代服务器平台相关合作，说明 AI 算力竞争正在从单一 G

2026-06-27 00:09:18 | 14 阅读

AI 周报特别篇：新闻背后隐藏的深层变革（一）

本周，AI 领域看似仅有零散资讯OpenAI 涉足芯片制造人形机器人价格下调顶尖大模型遭遇监管机器人进入工厂务工豆包发布专业版本然而，真正引人注目的并非新闻表象而是这些消息折射出 AI 领域正在发生的根本性转变数年间，AI 界最聚焦的是模型本身。谁的模型更强大。谁的回复更机智。谁的智能体更具人性。但如今，竞争已转向更深层面。OpenAI 携手 Broadcom 推出首款自研 AI 推理芯片 Jalapeño，旨在满足 ChatGPT、Codex、API 及未来智能体产品的大规模推理需求；Reuters、T

2026-06-26 19:23:06 | 8 阅读

前OpenAI高管清华开讲：AI时代最深层危机，是自我身份的迷失

昨日午前，原OpenAI市场拓展主管、国际AI顾问Zack Kass做客清华大学，发表了题为《The Next RenAlssance: Al andthe Expansion of Human Potential》的演说。据InfoQ现场观察，Zack并未纠结于特定模型、产品迭代或企业博弈，而是致力于探讨一个更为本质的命题：当智能成为廉价且普及的资源，AI将怎样重构社会、产业与个人生活。此前在OpenAI主导商业化进程的Kass，频繁与政企及各行业决策者对话。他持续关切的重点是，AI的红利究竟怎样才能切

2026-06-19 10:25:09 | 16 阅读

大模型价格战持续升温国产AI迎降价潮

本报记者袁传玺近期，DeepSeek、小米、腾讯云等主流国产大模型运营主体相继宣布下调API（应用程序编程接口）调用费用，多款主流模型降价幅度突破90%。有行业分析师对《证券日报》记者表示，大模型API价格的持续下探，本质上是技术红利释放与市场竞争博弈共同作用的结果。一方面，底层模型架构的持续迭代与推理系统效能的深度优化，正推动单位词元（Token）的计算成本实现阶梯式下降，为价格体系的重塑提供了底层支撑；另一方面，激烈的市场竞争进一步加速了这一进程，使得降价成为厂商在激烈角逐中抢占身位的现实选择。

2026-06-16 07:37:48 | 20 阅读