DeepSeek-V4预览版上线:百万上下文,性能全面领先
界面新闻记者 | 宋佳楠
4月24日,DeepSeek全新一代模型DeepSeek-V4预览版正式发布并同步开源。该模型具备百万字超长上下文,在Agent能力、世界知识及推理性能上均处于国内与开源领域的领先地位。昇腾超节点全系列产品均兼容支持DeepSeek V4系列模型。
此次推出的DeepSeek-V4预览版包含Pro和Flash两个版本,均配备百万字(1M)上下文能力,打破了长文本处理的场景限制。新版本同时支持思维模式切换、Json输出、工具调用、对话前缀续写等企业级特性,FIM补全功能在非思考模式下可正常使用,能够覆盖开发、办公、法律、金融等复杂场景需求。
若以1M Token的上下文窗口换算,大约相当于一次性处理75万字的中文内容,其容量之大,足以让人一次性读完《三体》三部曲的体量。
DeepSeek公布的参数显示,DeepSeek‑V4‑Pro激活参数49B、预训练数据33T,定位高性能旗舰;DeepSeek‑V4‑Flash激活参数13B、预训练数据32T,主打高速与低成本。
DeepSeek-V4的API服务信息也同步更新,其兼容OpenAI与Anthropic两大标准接口,开发者仅需将model_name改为deepseek-v4-pro或deepseek-v4-flash即可快速调用。原有的DeepSeek‑chat与DeepSeek‑reasoner接口将于3个月后正式停用,现阶段自动映射至Flash版本,以降低迁移成本。
在定价体系上,DeepSeek‑V4延续亲民路线。Flash版缓存命中输入每百万Token仅0.2元、未命中1元、输出2元;Pro版缓存命中1元、未命中12元、输出24元。DeepSeek表示,受限于当前高端算力资源,Pro版服务吞吐量有限,但随着下半年昇腾超节点产品批量上市,Pro版价格有望大幅下调,进一步释放高性能AI的普惠空间。
相较于前代模型,DeepSeek-V4-Pro的Agent能力显著增强。在Agentic Coding评测中,V4-Pro已达到当前开源模型的顶尖水平,并在其他Agent相关评测中同样表现优异。据悉,目前DeepSeek-V4已成为DeepSeek内部员工使用的Agentic Coding模型,据评测反馈使用体验优于Sonnet 4.5,交付质量接近Claude Opus 4.6非思考模式,但仍与Opus 4.6思考模式存在一定差距。
在世界知识测评中,DeepSeek-V4-Pro大幅领先其他开源模型,稍逊于顶尖闭源模型Gemini-Pro-3.1。而在数学、STEM、竞赛型代码的测评中,DeepSeek-V4-Pro超越了当前所有已公开评测的开源模型,达到世界顶级闭源模型的水平。
相比DeepSeek-V4-Pro,DeepSeek-V4-Flash在世界知识储备方面稍逊一筹,但展现出了接近的推理能力。而由于模型参数和激活更小,相较之下V4-Flash能够提供更加快捷、经济的API服务。
在Agent测评中,DeepSeek-V4-Flash在简单任务上与DeepSeek-V4-Pro旗鼓相当,但在高难度任务上仍有差距。
DeepSeek-V4还引入了一种新的注意力机制,通过token维度的压缩,结合DSA稀疏注意力,实现了全球领先的长上下文能力,并且相比于传统方法大幅降低了对计算和显存的需求。
当前国内竞品多聚焦参数竞赛与短文本交互,长上下文能力普遍停留在128K-256K区间,且开源版本能力有限。而DeepSeek‑V4凭借“1M上下文+全开源+双版本+全接口兼容”的组合优势,实现了差异化升级,也为全链条自主可控奠定了基础。
东吴证券(8.300, 0.02, 0.24%)认为,DeepSeekV4在数学逻辑推理、专业代码编程、通用知识理解、智能体应用等通用大模型核心领域均取得突破性进展,综合能力全面超越当前海外主流顶级大模型,性能表现断层领先。而在训练架构上,DeepSeekV4开始明显转向适配国产算力,成为国产大模型拥抱国产算力的关键里程碑,相关算力标的有望受益。
受DeepSeek‑V4预览版发布提振,国证半导体芯片指数(14046.985, 237.38, 1.72%)今日强势上涨1.06%,成分股海光信息(285.000, 21.60, 8.20%)上涨6.43%,龙芯中科(153.860, 3.20, 2.12%)上涨5.87%,华润微(54.730, 2.04, 3.87%)上涨3.68%,中芯国际(110.960, 4.98, 4.70%),圣邦股份(89.350, 2.36, 2.71%)等个股跟涨,半导体ETF鹏华上涨1.08%。
值得一提的是,两天前,据媒体援引知情人士消息称,腾讯和阿里正在洽谈投资DeepSeek,DeepSeek目前正寻求以超过200亿美元估值筹集资金。不过,DeepSeek并未对此予以回应。


