DeepSeek-V4成龙虾默认模型
全球Agent(智能体)风向标OpenClaw正式宣布接入DeepSeek-V4。
4月26日,澎湃新闻记者获悉,OpenClaw(龙虾)已正式官宣,全面接入DeepSeek-V4(Flash和Pro双版本),其中V4 Flash成为默认大模型,V4 Pro也同步上架模型库。
据OpenClaw披露,最新的4.24版本更新包含:实时语音通话全面贯通;DeepSeek-V4-Flash和Pro加入模型库;浏览器自动化新增坐标点击和更完善的恢复机制;Telegram、Slack、MCP、会话以及TTS均已修复。
如今在龙虾里配置DeepSeek API,默认模型将不再是Deepseek-Chat,而会变成Deepseek-V4-Flash。
“真想看看DeepSeek-V4究竟有多强!”消息一出,迅速在社交媒体上引发网友热议。龙虾火速接入DeepSeek-V4,也是在全球层面上对国产大模型DeepSeek能力的一次肯定。
DeepSeek这次的新模型发布,已迅速吸引AI圈高度关注。4月24日,DeepSeek-V4预览版正式上线并同步开源。DeepSeek-V4拥有百万字超长上下文,在Agent能力、世界知识和推理表现上均达到国内与开源领域领先水平,DeepSeek-V4以1.6万亿总参数和49B激活参数,成为全球最大的开源模型,而V4-Flash则以284B总参数和13B激活参数,给出更小、更快、更省的方案,推理能力在Max模式下几乎追平Pro版本。
相比前一代模型,DeepSeek-V4-Pro的Agent能力明显提升。在AgenticCoding评测中,V4-Pro已达到当前开源模型的最佳水准,并在其他Agent相关测试中同样有着出色表现。
据了解,DeepSeek-V4提出了一种全新的注意力机制,在Token维度进行压缩,并结合DSA稀疏注意力(DeepSeekSparseAttention),实现全球领先的长上下文能力,同时相比传统方案大幅降低计算和显存需求,未来1M(一百万)上下文将成为DeepSeek所有官方服务的标配。
此次DeepSeek再次在全球范围内引发关注,除了技术架构具有创新性之外,关键还在于其对国产芯片的全面适配,推动国产AI算力加速崛起。华为计算发布信息称,昇腾超节点产品已全面支持DeepSeek-V4。本次通过双方芯模技术紧密协同,实现昇腾超节点全系列产品支持DeepSeek-V4系列模型。
在DeepSeek-V4发布之后,寒武纪(1352.500, 29.50, 2.23%)也在第一时间宣布,基于vLLM推理框架完成了对此次DeepSeek-V4-flash和DeepSeek-V4-Pro两个版本的Day 0适配,相关适配代码已开源至GitHub社区。
其中,昇腾950通过融合kernel和多流并行技术,降低Attention计算和访存开销,显著提升推理性能,再结合多种量化算法,实现高吞吐、低时延的DeepSeek-V4模型推理部署。昇腾A3超节点系列产品也已全面适配,同时为方便用户快速微调,还提供了基于昇腾A3超节点的训练参考实现。
值得关注的是,DeepSeek也在持续推进AI“降价”浪潮。4月26日,DeepSeek宣布旗下V4-Pro模型API开启2.5折价格优惠,输入(缓存命中)价格为0.25元/百万Tokens,输入(缓存未命中)价格为3元/百万Tokens,输出价格为6元/百万Tokens,优惠期截至5月5日。