国产AI掀起价格风暴:DeepSeek直降七成,小米降幅近百分百,AI进入免费时代

发布时间：2026-06-01 08:41阅读：10

上周还在感叹AI使用成本太高，这周打开手机一看——价格集体崩盘，有的甚至直接跌破底线。

DeepSeek宣布旗舰模型永久下调75%，小米随后将自研大模型最高砍掉99%。两大国内AI厂商前后脚"放狠话"，不是玩什么限时促销，而是直接永久锁定最低价。

这意味着什么？意味着AI正在从"高端消费"转向"大众商品"。而大多数普通人，还不清楚这场价格战跟自己有什么关联。

DeepSeek这边：

5月22日，DeepSeek官方宣布，V4-Pro模型API价格将在5月31日限时优惠结束后，永久锁定为原价的四分之一——也就是下调75%。

具体什么水平？降价后的定价是这样的：

每百万tokens是什么概念？大约等同于50万字中文。0.025元处理50万字，这比一支雪糕还便宜。

小米更激进：

5月27日，雷军亲自转发官宣：MiMo-V2.5系列API永久降价，最高降幅达99%。

MiMo-V2.5-Pro降价后，输入缓存命中同样0.025元/百万tokens，和DeepSeek持平。而标准版MiMo-V2.5更划算，缓存命中只要0.02元/百万tokens——目前全球大模型API的最低价之一。

更激进的是，小米还宣布不再区分上下文窗口长度。以前使用长上下文要额外付费，现在不管你输入多少内容，统一价。这对那些需要AI处理长文档、长代码的用户而言，堪称降维打击。

光说国产便宜，你可能没什么概念。我们来对比一下海外大厂的价格：

换算一下：DeepSeek的输入价格大约是GPT-4o的六分之一，小米缓存命中的输入价格更是低到了不到GPT-4o的百分之一。Claude Opus 4.6输出25美元/百万tokens，小米只要不到0.3美元——相差80多倍。

"这么便宜，不得亏死？"这可能是很多人的第一反应。

答案是：不亏，至少不像你想的那么亏。

DeepSeek敢降价的底气，来源于自研的模型架构大幅降低了算力消耗。他们深度适配了国产芯片（昇腾950PR、寒武纪等），不依赖英伟达昂贵的GPU集群，硬件成本直接降了一截。

小米更夸张。他们打造了一整套推理优化方案：KV缓存数据搬运量降低到原来的七分之一，可缓存的token数量提升到近5倍。简单说就是——同样的算力，能服务更多的用户。

而且，两家公司的策略其实是一致的：用低价换生态。

DeepSeek的目标是让开发者大规模接入，形成技术生态壁垒。小米则明确表示要争夺"AI Agent生态的开发入口"——雷军已经宣布未来三年在AI领域投入600亿元。

他们不是在卖模型，是在建基础设施。就像当年阿里云、腾讯云刚推出时疯狂降价一样——先把用户圈进来再说。

你可能觉得"API价格"跟自己没关系，那是程序员的事。但这场价格战的连锁反应，已经渗透到你的日常了。

首先，你用的AI产品会越来越便宜。

DeepSeek网页版、小米AI助手、各种套壳AI工具，底层调用的就是这些API。上游降价了，下游产品的成本也跟着降。你已经能看到很多AI工具开始推出免费额度、低价套餐。

其次，更多AI功能会变成"标准配置"。

以前因为成本高，很多产品不敢开放AI功能。现在API便宜了，你的办公软件、浏览器、输入法、甚至购物APP，都可能内置AI助手。这就像当年短信从收费变成免费后，各种APP才开始大规模做通知推送。

最后，如果你是个"AI重度用户"，省钱更明显。

有人用AI写周报、改方案、翻译文档、做PPT大纲。按以前的价格，一个月可能花几十上百块。现在用国产API，几块钱搞定一个月的量。

便宜归便宜，但有个坑要提醒你。

多位开发者反馈：AI真正的成本，不是"提问"，而是"记忆"。

什么意思？比如你用AI写代码，第一次提问花100个tokens。但AI需要记住你之前说的所有内容，每次你继续对话，整个上下文都会被重新发送给模型。

对话10轮之后，实际消耗的tokens可能是你提问内容的几十倍。AI本身不贵，"让它记住上下文"才贵。

所以小米这次"不再区分上下文窗口长度"的定价策略，其实是打在了痛点上。以前上下文越长越贵，现在统一价，对长对话、长文档处理的用户来说是实打实的减负。

DeepSeek和小米只是打响了第一枪。

谷歌Gemini也在不断优化免费额度。整个AI行业正在从"参数竞赛"转向"价格竞赛"。

对消费者来说，这是好事。但更深层的变化是：AI正在从一种"技术能力"变成一种"基础设施"，就像电力、网络一样——没人会因为用了太多电而焦虑，未来也不会有人因为用了太多AI而心疼。

从今天开始，你可以把AI用得更"奢侈"一点了。