DeepSeek缓存输入费大跳水

发布时间：2026-04-27 12:53阅读：12

4月26日，快科技消息称，国产大模型DeepSeek官方公布，全系API输入缓存命中费用降至首发价格的1/10；叠加限时优惠后，V4-Pro缓存输入最低仅0.025元/百万Tokens，刷新全球大模型价格纪录。

本次调价覆盖DeepSeek-V4-Pro、V4-Flash全系列，重点下调的是输入缓存命中的使用成本。

DeepSeek-V4-Pro：由1元降到0.1元/百万Tokens，在5月5日前再享2.5折优惠，实际支付0.025元。

DeepSeek-V4-Flash：由0.2元降至0.02元/百万Tokens，不再叠加其他折扣。

缓存未命中和输出费用也同步下调：V4-Pro输入（未命中）3元、输出6元；V4-Flash输入（未命中）1元、输出2元，整体均为原价的1/4。

这次降价直接击中行业痛点，缓存输入价仅相当于GPT-5.5 Pro的1/700，企业在长文本、高频调用场景中的成本将明显减少。

对于RAG知识库、智能客服、文档分析等缓存命中率较高的应用，成本有望下降90%以上。

技术方面，DeepSeek-V4采用自研稀疏注意力架构，支持160k超长上下文，长文本处理效率领先。目前已适配华为云、阿里云等8大云平台及多家智算中心。

业内认为，DeepSeek此举有望重塑行业定价体系，加快AI应用普惠化，倒逼海外模型跟进降价，进一步巩固国产大模型的成本优势。

责任编辑：建嘉