标签

梁文锋内部沟通:DeepSeek V4将于四月下旬面世

发布时间:2026-04-10 14:27来源:新浪新闻阅读:9

作者 | 张弛

来源 |创智记

在经历多次发布延期的传闻后,备受瞩目的DeepSeek V4终于即将亮相。

据《创智记》从多位消息人士处获得的信息,DeepSeek创始人梁文锋近期在内部交流中表示,新一代旗舰大模型DeepSeek V4计划于4月下旬正式对外发布。

此前相关信息表明,DeepSeek V4不仅将具备万亿级的参数规模与百万级的上下文窗口,还将首次实现与华为昇腾等国产芯片的深度融合适配,这被视为中国人工智能产业在摆脱对CUDA依赖的进程中迈出的重要一步。

值得留意的是,3月29日晚间,DeepSeek服务中断长达13小时。官方当时仅解释为“服务器故障”,但多位开发者在服务恢复后察觉,模型输出逻辑出现了明显变化:代码结构更为清晰,逻辑严谨性大幅提升,SVG图形生成能力也显著增强。

业界普遍推测,此次服务中断实则是V4模型在进行灰度测试或全面部署。

据悉,V4模型将依据Apache 2.0协议进行开源,允许企业自主部署。根据最新的海外媒体报道,为迎接V4的发布,阿里巴巴、字节跳动、腾讯等国内科技巨头已提前预订了数十万片新一代AI算力芯片,计划通过云服务提供DeepSeek新模型,并将其整合进各自的AI产品线。受此需求推动,相关新型AI芯片产品的价格近期已上涨约20%。

在此之前,DeepSeek的发布时间已多次推迟。最初计划在2月中旬农历新年期间推出大参数版本,后因需深化国产算力适配、重构模型架构及打磨稳定性等原因而延期。

从量化投资领域跨界进入AI行业的梁文锋,正经历着属于他的转型与成长。

《晚点》报道显示,过去一年,尽管DeepSeek团队有核心成员离职(包括R1核心作者郭达雅等人),但“有人离开,更多人留下”,团队并未出现大规模人员流失。

自2025年下半年起,梁文锋开始更多地谈及产品化与商业化,组建了产品团队,招聘了专注于Agent方向的“模型策略产品经理”,并将业务从纯粹的模型研发向应用层面拓展。同时,他正在为公司进行估值,以明确员工期权的价值,为团队提供更清晰的发展预期。

面对豆包、千问、智谱、Kimi、MiniMax等竞争对手的激烈角逐,延迟数月的V4承载着巨大的市场期待——梁文锋能否再次打造出全球顶尖的开源大模型?

据了解,V4最主要的技术突破在于其LTM(长期记忆)能力的提升。

然而,多位与DeepSeek有深入合作关系的AI创业者向《创智记》表示,业界不宜抱有过高期望,V4可能很难重现去年DeepSeek-V3发布时所产生的影响力。

除DeepSeek V4外,腾讯的混元3.0大模型也定于4月正式发布。这是腾讯在2025年下半年完成团队架构调整、任命姚顺雨为首席AI科学家之后,推出的首款重量级大模型产品。