标签

DeepSeek再降价

发布时间:2026-04-27 12:47来源:新浪新闻阅读:5

界面新闻记者 | 宋佳楠

DeepSeek正不断重塑大模型普惠的边界。

4月26日,DeepSeek官方公布API调价公告,全系API输入缓存命中价格降至首发时的十分之一,V4-Pro再叠加限时2.5折,百万Tokens输入缓存命中最低仅0.025元,刷新全球大模型价格纪录。

按DeepSeek官方API定价页显示,此次降价覆盖V4系列全部模型,重点调整集中在输入缓存命中场景。其中DeepSeek-V4-Flash的输入缓存命中价格由0.2元/百万Tokens降至0.02元/百万Tokens。

面向企业级用户的DeepSeek-V4-Pro让利更大,原本1元/百万Tokens的缓存输入降到0.1元,2026年5月5日前还可叠加2.5折限时优惠,实际仅0.025元/百万Tokens;缓存未命中输入由12元降至3元,输出则从24元降至6元。

图源:DeepSeek官网

DeepSeek方面表示,DeepSeek-Chat与DeepSeek-Reasoner两个模型名称将于后续弃用。出于兼容性考虑,二者分别对应DeepSeek-V4-Flash的非思考和思考模式。

对比调整前后不难看出,高频调用、长文本处理场景的成本降幅超过90%,RAG知识库、智能客服、文档分析等缓存命中率高的应用,可直接迎来商用成本断崖式下滑,有助于打破AI规模化落地的成本束缚。

DeepSeek此次大幅降价的背后,与DeepSeek-V4的技术升级以及和昇腾生态的深度协同密切相关。

4月24日,DeepSeek-V4预览版正式亮相,同时开源Pro和Flash两款模型,二者都支持100万token超长上下文;自研稀疏注意力架构让推理算力消耗明显下降,Pro版单token算力仅为V3.2的27%,KV缓存压缩到10%,从底层完成成本优化。

DeepSeek方面公布的参数显示,DeepSeek-V4-Pro激活参数为49B、预训练数据33T,定位高性能旗舰;DeepSeek-V4-Flash激活参数为13B、预训练数据32T,主打高速和低成本。

与前代模型相比,DeepSeek-V4-Pro的Agent能力提升明显。在Agentic Coding评测中,V4-Pro已达到当前开源模型的最好水平,并在其他Agent相关评测中同样表现出色。据悉,目前DeepSeek-V4已成为DeepSeek内部员工使用的Agentic Coding模型,据评测反馈,使用体验优于Sonnet 4.5,交付质量接近Claude Opus 4.6非思考模式,但仍与Opus 4.6思考模式存在一定差距。

在世界知识测评中,DeepSeek-V4-Pro明显领先其他开源模型,略逊于顶尖闭源模型Gemini-Pro-3.1。而在数学、STEM、竞赛型代码测评中,DeepSeek-V4-Pro超过当前所有已公开评测的开源模型,能够与世界顶级闭源模型相抗衡。

相比DeepSeek-V4-Pro,DeepSeek-V4-Flash在世界知识储备方面稍显不足,但展现出接近的推理能力。而由于模型参数和激活规模更小,相比之下V4-Flash能够提供更快、更省的API服务。

DeepSeek-V4还提出了一种新的注意力机制,在token维度做压缩,并结合DSA稀疏注意力(DeepSeek Sparse Attention),实现全球领先的长上下文能力,同时较传统方法显著降低了对计算和显存的需求。

更值得关注的是,昇腾超节点全系列产品已支持DeepSeek V4系列模型。这也说明,DeepSeek释放出更多国产化信号。

DeepSeek-V4在一份技术报告中提到,“在英伟达GPU和华为昇腾NPU两个平台上验证了细粒度EP(专家并行)方案。与强力的非融合(non-fused)基线相比,该方案在通用推理任务中实现1.50-1.73倍加速;在对延迟较敏感的场景(如强化学习(RL)rollout和高速Agent服务)中,最高可达1.96倍加速。”

DeepSeek强调,随着下半年昇腾超节点全系列产品批量上市,Pro版价格有望进一步下探。

DeepSeek-V4发布后,高盛在分析报告中指出,DeepSeek V4的核心价值在于以更低成本支撑更复杂的智能体应用落地,从而打开AI应用规模化的新空间。对于接入昇腾超节点,高盛认为DeepSeek的成本竞争力将继续增强,为更大范围的应用落地提供条件。此外,在芯片持续收紧的背景下,中国头部AI模型向国产算力迁移的趋势也获得了头部玩家的明确背书。

高盛报告还援引消息称,腾讯和阿里正在洽谈以超过200亿美元估值投资DeepSeek,而智谱和MiniMax的最新市值分别约为530亿美元和310亿美元,这笔潜在交易折射出巨头对于稀缺顶级AI能力的争夺逻辑。

而华泰证券(18.830, 0.05, 0.27%)认为,市场容易把V4理解为“降本并压低算力、存储需求”,但更关键的边际变化在于长上下文成本下降后,复杂Agent、多文档分析、长周期任务、在线学习等场景的可用性提升,推理调用量和存储访问频次有望进一步扩张。

责任编辑:杨赐

新浪财经声明:此消息系转载自合作媒体,新浪财经登载此文出于传递更多信息之目的,文章内容仅供参考,不构成投资建议。

郑重声明:1.根据《证券法》规定,禁止编造、传播虚假信息或者误导性信息,扰乱证券市场;2.用户在本社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。