标签

DeepSeek V4深度解析:AI算力与云服务的投资机遇

发布时间:2026-04-26 15:56来源:微信阅读:5

知识星球汇集了最新的个股点评、行业动态、市场资讯、内部纪要、电话会议实录及深度研报。无需耗费大量时间,即可高效获取最具价值的投研情报。

高盛指出,相较于去年DeepSeek的关键节点,DeepSeek V4模型体现了在计算效率与开源策略上的持续精进,且架构上实现了显著升级。该升级将进一步提升计算成本效益,为AI应用的普及与推广铺平道路,加速代理应用的落地。未来,模型在编码成功率、任务完成度及多模态能力上的表现,将成为定价的关键分水岭。建议继续关注云服务与数据中心领域,重点推荐万国数据、世纪互联、阿里巴巴及金山云。

DeepSeek V4核心亮点概览:

DeepSeek于2026年4月24日推出了V4预览版,包含Pro和Flash两个版本。Pro版作为旗舰,拥有1.6万亿参数(激活490亿),Flash版则较小,参数为2840亿(激活130亿)。目前DeepSeek仍深耕基础文本领域,而互联网巨头及独立厂商如MiniMax则更侧重于全模态发展,旨在追求通用人工智能。

借助架构突破,Pro和Flash模型均支持100万标记的超长上下文。与V3.2相比,推理FLOPS和KV缓存占用大幅下降,主要得益于三项关键优化。除了DeepSeek MoE技术外,在多词预测方面实现了以下升级:

混合注意力架构融合了压缩稀疏注意力(CSA)与重度压缩注意力(HCA)。CSA先沿序列压缩KV缓存再稀疏化,HCA则采用更激进的压缩但仍保持密集关注。这使得V4在处理长输入时所需保留的临时内存显著减少。

mHC提升训练稳定性:DeepSeek-V4引入mHC机制,确保信息在多层传递时的稳定性。

深搜V4采用Muon作为主训练优化器,针对小模块仍用AdamW。因架构更复杂,Muon有助于模型稳定学习。相比V3.2,V4效率大幅提升。在100万上下文下,V4-Pro单标记推理FLOPs仅占27%,KV缓存仅占10%;V4-Flash则分别为10%和7%。这表明长上下文负载效率提高,适合长周期任务而非简单短提示。

DeepSeek-V4的强大能力继续确立了云与数据中心作为首选子行业的地位(重点推荐:万国数据、世纪互联、阿里巴巴、金山云)。随着企业AI代理及消费级AI助手的普及,对算力的需求激增,将提升云服务的定价权。效率提升为更广泛的AI应用落地创造了条件。

对于AI模型,鉴于近期迭代加速,DeepSeek V4(对比百度文心一言K2.6、阿里通义千问3.6-Max、腾讯混元3、小米V2.5及MiniMax M3等)在编码、任务完成成功率及多模态能力上,很可能是未来定价权的决定性因素。

独立企业相比互联网巨头,优势在于高效的组织与决策,能精准把握趋势。例如MiniMax的高效设计与推理能力,使其基础文本API即使在激烈竞争中也能维持40%的毛利率。

互联网巨头则凭借核心业务的强劲现金流,处于布局AI基础设施的最佳位置,且如百度等设立独立激励机制,将进一步加速这一进程。

投资逻辑与产业链梳理

核心逻辑:昇腾生态爆发,DeepSeek-V4全面适配华为昇腾,国产替代加速(华丰科技、杰华特、拓维信息等直接受益);算力需求刚性,参数升级带动服务器、液冷、光模块持续放量;商业化加速,行业应用从“可用”到“好用”,金融、办公、教育率先落地。

一、上游:AI芯片与核心零部件(算力底座)

1. AI芯片/GPU/DCU

海光信息(688041):DCU深算系列完成DeepSeek V3/R1国产化适配,国产算力基座核心。

寒武纪(688256):思元系列芯片适配DeepSeek-V3.2,开源推理引擎vLLM-MLU。

华为昇腾(未上市):DeepSeek-V4核心算力底座,与英伟达并列进入硬件验证清单。

2. 高速连接器/PCB/电源管理

华丰科技(688629):昇腾超节点铜缆连接器主力供应商,受益昇腾950放量。

杰华特(688141):昇腾超节点电源管理芯片(PSU/HVDC)核心供应商。

中际旭创(300308):800G/1.6T高速光模块,用于算力集群互联。

二、中游:服务器/智算中心/模型服务(算力交付)

1. AI服务器/整机

浪潮信息(000977):为DeepSeek北京亦庄智算中心提供H800服务器集群;发布预置DeepSeek的海若一体机。

中科曙光(603019):承建DeepSeek杭州训练中心液冷系统;参股海光信息。

拓维信息(002261):承接DeepSeek超算中心过半基建订单;“兆瀚”服务器适配昇腾。

紫光股份(000938):新华三UniCube一体机预置DeepSeek模型。

2. 液冷/数据中心

英维克(002837):液冷机柜/冷板供应商,适配高密度算力集群。

润泽科技(300442):廊坊数据中心提供3000+机柜,间接蒸发冷却。

3. 算力租赁/模型部署

优刻得-W(688158):云平台上线DeepSeek API,提供算力租赁。

鸿博股份(002229):子公司英博数科部署DeepSeek-V3/R1,提供模型+算力一体化服务。

软通动力(301236):昇腾生态服务商,为DeepSeek提供模型适配与私有化部署。