标签

大模型价格暴跌97.5%!腾讯云掀桌子,AI正在成为新基建

发布时间:2026-06-03 13:14来源:微信阅读:3

点击上方蓝字,关注我不迷路~

97.5%,看到这个数字时,我第一反应是眼花看错了。

6月2日,腾讯云宣布自6月3日起,DeepSeek-V4系列模型调用费用大幅下调——V4-Pro推理输入输出降幅75%,缓存命中价格更是暴跌97.5%,从0.001元/千tokens直接降至0.000025元。

说人话:去年用一天AI的开销,现在能支撑40天。

但这不是孤例。5月22日,DeepSeek官方将V4-Pro的2.5折"限时特惠"直接转为永久定价,一个月内第四次调价。5月27日,小米MiMo-V2.5紧随其后,最高降幅达99%,Pro版定价与DeepSeek完全对标。海外方面,OpenAI、Anthropic在涨价,国内却在断崖式降价。

这不是价格战,是价格崩塌。

一、为何能如此低价?

有人说是"亏本赚流量"。对,但不全对。

降价的底气来自三重因素叠加。

其一,架构革新。 MiniMax刚发布的M3模型就是典型案例——采用自研MSA稀疏注意力架构,将每个token的计算量压缩到上代模型的1/20。如何实现?传统Transformer每个token需"审视"所有其他token,复杂度为O(n²),100万token直接爆内存。MSA的思路是:无需每个token都看全局,局部窗口+全局锚点+随机采样三层稀疏,动态门控决定每次审视范围,计算量与上下文长度解耦。结果:1M上下文prefilling加速9倍,decoding加速15倍,内存从OOM到40GB可运行。

这不是微调,是底层重构。推理成本的断崖式下降,首先源于架构级的效率飞跃。

其二,推理优化。 量化精度提升、KV Cache压缩、动态批处理调度——这些工程优化过去半年取得突破性进展,单Token的实际算力消耗大幅降低。据接近腾讯云技术团队的人士透露,新一代定制化硬件的折旧摊销模型也与公有云通用算力不同,进一步压低了边际成本。

其三,战略性补贴。 这是最核心的。多名业内人士确认,当前价格已触及甚至穿透短期可变成本线。腾讯云在主动承担部分战略性亏损,以换取智能体平台的市场占有率。

说白了:模型本身不盈利,但模型能把开发者吸引过来,后端的平台服务、工作流引擎、企业级集成才是真正的生意。

模型是入口,平台才是护城河。

二、谁受损,谁获益

这轮价格雪崩的赢家和输家非常清晰。

最大受益者:中小企业和个人开发者。

以前使用AI是"按月做预算",现在是"几乎不用做预算"。有开发者算过账:一个学生用Cursor免费版+自备API Key,月均3美元就能完成一年前要花20美元才能做的事。AI编程工具的日均使用量三年增长近5倍——黄仁勋在GTC上披露,2023年全球3亿次,2026年预计达14亿次。

短期受损:云厂商和独立模型公司。

云厂商的模型调用利润被极限压缩。独立模型公司更艰难——仅提供裸API、缺乏上层平台支撑的供应商,即便跟进降价,也复制不了大厂的飞轮效应。一位SaaS创业者透露,他们原本计划基于某独立模型开发产品,现在正在重新评估技术选型。

长期受益:整个AI应用生态。

当调用成本趋近于零,AI应用创业的黄金窗口就打开了。这与早期云计算市场如出一辙——计算资源先免费再低价,先把开发者圈进来建生态,再在增值服务上变现。

三、价格战的终点是什么?

回顾互联网发展史,每一轮"基础设施级"的价格战都走过相似的路径:先烧钱抢市场,形成规模效应后走向寡头化。

云存储如此,CDN如此,大模型大概率亦如此。

但这次有个差异:国产模型在降价,海外模型在涨价。 OpenAI的GPT-5.5输入价格虽也下调50%,但绝对值仍是国产模型的数十倍;Anthropic的Claude Sonnet 4降价后,输入5美元/百万token,输出15美元/百万token——对比DeepSeek V4-Pro的输入3元/百万token、输出6元/百万token,差距不止一个数量级。

这背后是两条路线的分歧:海外走"高价值闭环",国产走"低门槛普惠"。短期看,普惠路线在争夺开发者生态上更具进攻性;长期看,谁能先在AI应用层打造出杀手级产品,谁就掌握了定价权。

腾讯控股股价当日大涨10.46%,单日市值增长超4100亿港元——市场用真金白银表态:AI的下半场,不是比谁卖得贵,是比谁用得广。

四、当AI调用比打电话还便宜

6月1日,MiniMax M3发布当天,有人在开发者社区算了一笔账:用M3处理100万token的长文本任务,成本不到一杯咖啡。

而半年前,同样的任务要花一顿正餐的开销。

这是基础设施从"奢侈品"变成"日用品"的临界点。就像2008年智能手机流量费从1元/MB降到几十元包月,移动互联网的应用大爆发才真正开启。

AI的应用大爆发,可能就在今年。

97.5%不是一个数字,是一个信号:AI不再是少数人的专利工具,它正在成为这个时代的水电基础——你无需关心发电厂在哪,拧开水龙头,水就在那。

唯一的问题是:你准备好了吗?