标签

从“对话便宜”到“智能体便宜”:DeepSeek-V4引领大模型价格战进入智能体时代

发布时间:2026-04-24 17:52来源:新浪新闻阅读:5

每经记者兰素英 每经编辑王嘉琦 报道

历经15个月的等待,今日(4月24日),DeepSeek-V4(预览版)终于面世,发布时间紧随OpenAI发布GPT-5.5之后仅数小时。

在DeepSeek-V4约1000字的产品介绍中,“智能体”一词被反复提及,共出现11次。

DeepSeek-V4通过专家模式(Pro)与快速模式(Flash)的双版本配置,将大模型价格战从“对话便宜”推向“智能体便宜”的新阶段。

凭借全新的稀疏注意力机制与同策略蒸馏技术,DeepSeek-V4将推理成本压缩至新低,其中V4-Flash版本的输出价格仅为GPT-5.5 Pro的1.55‰,而V4-Pro版本性能可媲美全球顶级闭源模型。

“低价快模型+高价强模型”的组合策略,使DeepSeek-V4为智能体的大规模落地算清了成本账。

V4发布后不久,全球最大AI模型API聚合平台OpenRouter上已有用户开始调用。截至4月24日15点,OpenRouter平台上V4-Pro的调用量达2.99亿Token,V4-Flash达3.99亿Token。

DeepSeek延续其一贯的“普惠”路线。

V4-Flash:缓存命中输入0.2元/百万Token,缓存未命中输入1元/百万Token,输出2元/百万Token。

V4-Pro:缓存命中输入1元/百万Token,缓存未命中输入12元/百万Token,输出24元/百万Token。

不过,与官方API定价不同,OpenRouter平台综合各服务商渠道报价,加权计算实际使用价格,该价格会动态调整。

《每日经济新闻》记者统计OpenRouter数据发现,截至4月24日13:30,本周调用量领先的国内外主流AI大模型中,DeepSeek-V4-Flash成本优势显著,每百万Token平均输出价低至0.279美元,仅为OpenAI新发布的GPT-5.5 Pro(180美元)的1.55‰。

Anthropic Claude Opus系列、OpenAI GPT-5.4以及谷歌Gemini 3.1 Pro Preview等大模型的输出价格均在12至25美元区间,是DeepSeek-V4-Flash的数十倍。

在输入端,DeepSeek-V4-Flash每百万Token平均输入价仅为0.07美元,仅略高于阶跃星辰Step 3.5 Flash的0.031美元,显著低于其他国内外主流大模型。

值得关注的是,业界一直关注DeepSeek-V4是否使用国产算力。DeepSeek在产品介绍中用微小文字表示,受高端算力限制,目前V4-Pro的服务吞吐非常有限,预计下半年昇腾950超节点批量上市后,V4-Pro价格将大幅下调。

DeepSeek-V4如何实现低价?

在58页的技术报告《DeepSeek V4:迈向高效的百万Token上下文智能》中,DeepSeek指出,V4开创了一种全新注意力机制,在Token维度进行压缩,并结合DSA稀疏注意力(DeepSeek Sparse Attention),相比传统方法大幅降低计算与显存需求。

这一路线与V3.2一脉相承。V3.2-Exp去年9月首次引入DSA时,推理成本就已腰斩一次。

真正让V4与V3.2在方法论上分道扬镳的,是后训练(post-training)。技术报告提到,V3.2的混合强化学习(mixed RL)阶段在V4中被整体替换为同策略蒸馏(On-Policy Distillation)。

新流程分为两段:首先分别训练数十个领域专家模型,涵盖数学、代码、智能体、指令跟随,产出各领域极强的“偏科生”;

第二阶段,将十几个“教师模型”蒸馏到一个“学生模型”中。这种“先分头培养专家、再合并成通才”的路线,DeepSeek在报告中直接点名参考了思维机器实验室去年10月的on-policy distillation工作。

AI的应用场景已从对话进入智能体阶段。

OpenRouter与a16z联合发布的《2025 AI使用报告》覆盖超100万亿Token的匿名元数据,其中一组数据极其关键:编程任务的Token占比从2025年初的11%飙升至50%以上,成为平台最大单一使用品类。同时,智能体驱动的工作流产生的输出Token已超过平台总输出的一半。

过去的问答式AI,一轮对话消耗几百到几千Token,用户停止提问则Token不再消耗。而在智能体模式下,机器可持续在后台运行流程。极端假设智能体全天候运行,每天可能消耗数十亿Token。

因此,中国开源模型阵营几乎全部头部玩家都将智能体作为主攻方向,从架构到训练全链路为智能体场景做原生适配。

但仅仅便宜还不够,这一轮真正拉开差距的,是在智能体场景下“跑得好”。

在此背景下,DeepSeek-V4似乎专为智能体而生。DeepSeek在1000字的V4产品介绍中,“智能体”一词出现11次。

价格较高但能力强的V4-Pro与快捷高效且价格便宜的V4-Flash的组合,恰好契合智能体场景。

DeepSeek表示,V4-Pro性能比肩顶级闭源模型,而V4-Flash则是更快捷高效的经济之选。

● 智能体能力:相比前代模型,DeepSeek-V4-Pro的智能体能力显著增强。在Agentic Coding评测中,V4-Pro已达到当前开源模型最佳水平,并在其他智能体相关评测中同样表现优异。目前DeepSeek-V4已成为公司内部员工使用的Agentic Coding模型。

● 世界知识:DeepSeek-V4-Pro在世界知识测评中,大幅领先其他开源模型。

● 推理性能:在数学、STEM、竞赛型代码的测评中,DeepSeek-V4-Pro超越当前所有已公开评测的开源模型,取得了比肩世界顶级闭源模型的优异成绩。

相比V4-Pro,V4-Flash在世界知识储备方面稍逊一筹,但展现出了接近的推理能力。由于模型参数和激活更小,V4-Flash能提供更快捷、经济的API服务。

在智能体测评中,DeepSeek-V4-Flash在简单任务上与V4-Pro旗鼓相当,但在高难度任务上仍有差距。

普通任务调用V4-Flash等低价模型,高难任务才调用V4-Pro。对DeepSeek来说,未来不是单纯比谁最强,而是比综合任务成本。

因此,V4-Flash的意义不是“便宜一点”,而是将智能体场景变成可以算账的生意。