DeepSeek再降价

发布时间：2026-04-27 12:47阅读：9

界面新闻记者 | 宋佳楠

DeepSeek正不断重塑大模型普惠的边界。

4月26日，DeepSeek官方公布API调价公告，全系API输入缓存命中价格降至首发时的十分之一，V4-Pro再叠加限时2.5折，百万Tokens输入缓存命中最低仅0.025元，刷新全球大模型价格纪录。

按DeepSeek官方API定价页显示，此次降价覆盖V4系列全部模型，重点调整集中在输入缓存命中场景。其中DeepSeek-V4-Flash的输入缓存命中价格由0.2元/百万Tokens降至0.02元/百万Tokens。

面向企业级用户的DeepSeek-V4-Pro让利更大，原本1元/百万Tokens的缓存输入降到0.1元，2026年5月5日前还可叠加2.5折限时优惠，实际仅0.025元/百万Tokens；缓存未命中输入由12元降至3元，输出则从24元降至6元。

图源：DeepSeek官网

DeepSeek方面表示，DeepSeek-Chat与DeepSeek-Reasoner两个模型名称将于后续弃用。出于兼容性考虑，二者分别对应DeepSeek-V4-Flash的非思考和思考模式。

对比调整前后不难看出，高频调用、长文本处理场景的成本降幅超过90%，RAG知识库、智能客服、文档分析等缓存命中率高的应用，可直接迎来商用成本断崖式下滑，有助于打破AI规模化落地的成本束缚。

DeepSeek此次大幅降价的背后，与DeepSeek-V4的技术升级以及和昇腾生态的深度协同密切相关。

4月24日，DeepSeek-V4预览版正式亮相，同时开源Pro和Flash两款模型，二者都支持100万token超长上下文；自研稀疏注意力架构让推理算力消耗明显下降，Pro版单token算力仅为V3.2的27%，KV缓存压缩到10%，从底层完成成本优化。

DeepSeek方面公布的参数显示，DeepSeek-V4-Pro激活参数为49B、预训练数据33T，定位高性能旗舰；DeepSeek-V4-Flash激活参数为13B、预训练数据32T，主打高速和低成本。

与前代模型相比，DeepSeek-V4-Pro的Agent能力提升明显。在Agentic Coding评测中，V4-Pro已达到当前开源模型的最好水平，并在其他Agent相关评测中同样表现出色。据悉，目前DeepSeek-V4已成为DeepSeek内部员工使用的Agentic Coding模型，据评测反馈，使用体验优于Sonnet 4.5，交付质量接近Claude Opus 4.6非思考模式，但仍与Opus 4.6思考模式存在一定差距。

在世界知识测评中，DeepSeek-V4-Pro明显领先其他开源模型，略逊于顶尖闭源模型Gemini-Pro-3.1。而在数学、STEM、竞赛型代码测评中，DeepSeek-V4-Pro超过当前所有已公开评测的开源模型，能够与世界顶级闭源模型相抗衡。

相比DeepSeek-V4-Pro，DeepSeek-V4-Flash在世界知识储备方面稍显不足，但展现出接近的推理能力。而由于模型参数和激活规模更小，相比之下V4-Flash能够提供更快、更省的API服务。

DeepSeek-V4还提出了一种新的注意力机制，在token维度做压缩，并结合DSA稀疏注意力（DeepSeek Sparse Attention），实现全球领先的长上下文能力，同时较传统方法显著降低了对计算和显存的需求。

更值得关注的是，昇腾超节点全系列产品已支持DeepSeek V4系列模型。这也说明，DeepSeek释放出更多国产化信号。

DeepSeek-V4在一份技术报告中提到，“在英伟达GPU和华为昇腾NPU两个平台上验证了细粒度EP（专家并行）方案。与强力的非融合（non-fused）基线相比，该方案在通用推理任务中实现1.50-1.73倍加速；在对延迟较敏感的场景（如强化学习（RL）rollout和高速Agent服务）中，最高可达1.96倍加速。”

DeepSeek强调，随着下半年昇腾超节点全系列产品批量上市，Pro版价格有望进一步下探。

DeepSeek-V4发布后，高盛在分析报告中指出，DeepSeek V4的核心价值在于以更低成本支撑更复杂的智能体应用落地，从而打开AI应用规模化的新空间。对于接入昇腾超节点，高盛认为DeepSeek的成本竞争力将继续增强，为更大范围的应用落地提供条件。此外，在芯片持续收紧的背景下，中国头部AI模型向国产算力迁移的趋势也获得了头部玩家的明确背书。

高盛报告还援引消息称，腾讯和阿里正在洽谈以超过200亿美元估值投资DeepSeek，而智谱和MiniMax的最新市值分别约为530亿美元和310亿美元，这笔潜在交易折射出巨头对于稀缺顶级AI能力的争夺逻辑。

而华泰证券(18.830, 0.05, 0.27%)认为，市场容易把V4理解为“降本并压低算力、存储需求”，但更关键的边际变化在于长上下文成本下降后，复杂Agent、多文档分析、长周期任务、在线学习等场景的可用性提升，推理调用量和存储访问频次有望进一步扩张。

责任编辑：杨赐

新浪财经声明：此消息系转载自合作媒体，新浪财经登载此文出于传递更多信息之目的，文章内容仅供参考，不构成投资建议。

郑重声明：1.根据《证券法》规定，禁止编造、传播虚假信息或者误导性信息，扰乱证券市场；2.用户在本社区发表的所有资料、言论等仅代表个人观点，与本网站立场无关，不对您构成任何投资建议。用户应基于自己的独立判断，自行决定证券投资并承担相应风险。

← 上一篇：吉利银河之光2代首发，新能源越野架构亮相下一篇：俞浩连发微博痛批小红书 →