DeepSeek缓存输入费大跳水
4月26日,快科技消息称,国产大模型DeepSeek官方公布,全系API输入缓存命中费用降至首发价格的1/10;叠加限时优惠后,V4-Pro缓存输入最低仅0.025元/百万Tokens,刷新全球大模型价格纪录。
本次调价覆盖DeepSeek-V4-Pro、V4-Flash全系列,重点下调的是输入缓存命中的使用成本。
DeepSeek-V4-Pro:由1元降到0.1元/百万Tokens,在5月5日前再享2.5折优惠,实际支付0.025元。
DeepSeek-V4-Flash:由0.2元降至0.02元/百万Tokens,不再叠加其他折扣。
缓存未命中和输出费用也同步下调:V4-Pro输入(未命中)3元、输出6元;V4-Flash输入(未命中)1元、输出2元,整体均为原价的1/4。
这次降价直接击中行业痛点,缓存输入价仅相当于GPT-5.5 Pro的1/700,企业在长文本、高频调用场景中的成本将明显减少。
对于RAG知识库、智能客服、文档分析等缓存命中率较高的应用,成本有望下降90%以上。
技术方面,DeepSeek-V4采用自研稀疏注意力架构,支持160k超长上下文,长文本处理效率领先。目前已适配华为云、阿里云等8大云平台及多家智算中心。
业内认为,DeepSeek此举有望重塑行业定价体系,加快AI应用普惠化,倒逼海外模型跟进降价,进一步巩固国产大模型的成本优势。
责任编辑:建嘉

