标签

国产AI掀起价格风暴:DeepSeek直降七成,小米降幅近百分百,AI进入免费时代

发布时间:2026-06-01 08:41来源:微信阅读:4

上周还在感叹AI使用成本太高,这周打开手机一看——价格集体崩盘,有的甚至直接跌破底线。

DeepSeek宣布旗舰模型永久下调75%,小米随后将自研大模型最高砍掉99%。两大国内AI厂商前后脚"放狠话",不是玩什么限时促销,而是直接永久锁定最低价。

这意味着什么?意味着AI正在从"高端消费"转向"大众商品"。而大多数普通人,还不清楚这场价格战跟自己有什么关联。

DeepSeek这边:

5月22日,DeepSeek官方宣布,V4-Pro模型API价格将在5月31日限时优惠结束后,永久锁定为原价的四分之一——也就是下调75%。

具体什么水平?降价后的定价是这样的:

每百万tokens是什么概念?大约等同于50万字中文。0.025元处理50万字,这比一支雪糕还便宜。

小米更激进:

5月27日,雷军亲自转发官宣:MiMo-V2.5系列API永久降价,最高降幅达99%。

MiMo-V2.5-Pro降价后,输入缓存命中同样0.025元/百万tokens,和DeepSeek持平。而标准版MiMo-V2.5更划算,缓存命中只要0.02元/百万tokens——目前全球大模型API的最低价之一。

更激进的是,小米还宣布不再区分上下文窗口长度。以前使用长上下文要额外付费,现在不管你输入多少内容,统一价。这对那些需要AI处理长文档、长代码的用户而言,堪称降维打击。

光说国产便宜,你可能没什么概念。我们来对比一下海外大厂的价格:

换算一下:DeepSeek的输入价格大约是GPT-4o的六分之一,小米缓存命中的输入价格更是低到了不到GPT-4o的百分之一。Claude Opus 4.6输出25美元/百万tokens,小米只要不到0.3美元——相差80多倍。

"这么便宜,不得亏死?"这可能是很多人的第一反应。

答案是:不亏,至少不像你想的那么亏。

DeepSeek敢降价的底气,来源于自研的模型架构大幅降低了算力消耗。他们深度适配了国产芯片(昇腾950PR、寒武纪等),不依赖英伟达昂贵的GPU集群,硬件成本直接降了一截。

小米更夸张。他们打造了一整套推理优化方案:KV缓存数据搬运量降低到原来的七分之一,可缓存的token数量提升到近5倍。简单说就是——同样的算力,能服务更多的用户。

而且,两家公司的策略其实是一致的:用低价换生态。

DeepSeek的目标是让开发者大规模接入,形成技术生态壁垒。小米则明确表示要争夺"AI Agent生态的开发入口"——雷军已经宣布未来三年在AI领域投入600亿元。

他们不是在卖模型,是在建基础设施。就像当年阿里云、腾讯云刚推出时疯狂降价一样——先把用户圈进来再说。

你可能觉得"API价格"跟自己没关系,那是程序员的事。但这场价格战的连锁反应,已经渗透到你的日常了。

首先,你用的AI产品会越来越便宜。

DeepSeek网页版、小米AI助手、各种套壳AI工具,底层调用的就是这些API。上游降价了,下游产品的成本也跟着降。你已经能看到很多AI工具开始推出免费额度、低价套餐。

其次,更多AI功能会变成"标准配置"。

以前因为成本高,很多产品不敢开放AI功能。现在API便宜了,你的办公软件、浏览器、输入法、甚至购物APP,都可能内置AI助手。这就像当年短信从收费变成免费后,各种APP才开始大规模做通知推送。

最后,如果你是个"AI重度用户",省钱更明显。

有人用AI写周报、改方案、翻译文档、做PPT大纲。按以前的价格,一个月可能花几十上百块。现在用国产API,几块钱搞定一个月的量。

便宜归便宜,但有个坑要提醒你。

多位开发者反馈:AI真正的成本,不是"提问",而是"记忆"。

什么意思?比如你用AI写代码,第一次提问花100个tokens。但AI需要记住你之前说的所有内容,每次你继续对话,整个上下文都会被重新发送给模型。

对话10轮之后,实际消耗的tokens可能是你提问内容的几十倍。AI本身不贵,"让它记住上下文"才贵。

所以小米这次"不再区分上下文窗口长度"的定价策略,其实是打在了痛点上。以前上下文越长越贵,现在统一价,对长对话、长文档处理的用户来说是实打实的减负。

DeepSeek和小米只是打响了第一枪。

谷歌Gemini也在不断优化免费额度。整个AI行业正在从"参数竞赛"转向"价格竞赛"。

对消费者来说,这是好事。但更深层的变化是:AI正在从一种"技术能力"变成一种"基础设施",就像电力、网络一样——没人会因为用了太多电而焦虑,未来也不会有人因为用了太多AI而心疼。

从今天开始,你可以把AI用得更"奢侈"一点了。