标签

AI重应用,不拼排名

发布时间:2026-04-27 09:10来源:微信阅读:4

2026年4月24日,DeepSeek V4 预览版正式发布。这是 DeepSeek(深度求索)推出的新一代开源 MoE 大模型,统一配置 1M 超长上下文,重点强化长文本效率与 Agent 能力,并提供 Pro/Flash 两个版本。

它原生支持 1M 上下文,整本书或整个代码库都能直接塞进来,不再需要 RAG 切块处理。同时它全面兼容华为昇腾 950PR,训练框架也从 CUDA 转向 CANN;单卡推理性能达到英伟达 H20 的 2.87 倍,能耗降低 40%。

这条消息在国内外都掀起了不小震动,我也因此接受了几次采访。对于这样一个版本的推出,国外媒体在惊讶之余认为它与美国大模型仍有距离,但原生长文、开源和框架迁移带来的冲击,确实非常震撼。

中国大模型发展到这个阶段,我现在更关注的已经不是模型本身,而是应用;我也更在意价格,因为这会直接决定应用能不能大规模铺开。

看一个人,通常不是看那种一直考试拿第一、始终排名靠前的,而是看一群学生里最后发展最好的人。往往成绩中等、发展均衡的那位,才更可能走到最后。人工智能也是一样。

这些年,人工智能被炒得很热,美国尤其热衷于比芯片性能排名和大模型参数排名。当然,我们国内也有一些人拿这些榜单来说事,觉得中国大模型和美国相比还有差距。

但大模型究竟是用来干什么的?它不是拿来比参数,也不是拿来互相排位做研究展示的。大模型最终会变成人工智能的底层能力,为各种应用提供支撑。中国的发展已经走到世界前列,在我看来其实已经超过美国。

中国大模型的训练框架,已经从过去必须依赖英伟达 CUDA,逐步转向自己的框架。这说明在这个领域,我们正在慢慢掌握主动权,用自有框架和芯片也能完成任务,英伟达芯片不再是唯一依赖,只是辅助。

中国大模型是开源的,一方面给大量中小企业带来了机会,另一方面也吸收了中小企业自身的研发力量,持续推动模型能力不断提升。

更重要的是,在性能并不差的前提下,我们的大模型 API 价格远低于美国,通常要便宜 50% 到 80%。这意味着使用模型的用户和企业,能省下大量成本。

我们自己也在做居家机器人,推理时会调用大量 Token,所以找到更便宜的 Token,就是部署过程中的关键工作。昨天在我们的 AI 群里,我看到同事贴出了 DeepSeek V4 Pro 的价格,我们的 CEO 直呼:真划算。这就是用户最真实的反馈。

DeepSeek V4 的性能已经站到了世界前列,单纯看参数排名其实意义不大,也不会有多少用户真正去在意。反倒是比同类产品便宜 50% 以上的价格,才是真正的冲击力。性能已经不弱,价格又足够低,这才是最核心的竞争力。

如果去听学术界的说法,他们的评价标准大概率还是参数排名,会觉得美国人工智能依旧领先。可从产业角度看,重度依赖人工智能推理的中小企业,只要碰到足够强的性能、开源的大模型和极有竞争力的价格,就不会再选择别的模型。

当产品性能已经达到这个水平,基础框架又逐步变成自己的框架,服务价格还具备极强竞争力时,这就是中国人工智能的底气,也是未来中国人工智能最强的竞争优势。

对整个社会来说,人工智能的本质是一种服务,而不是单纯的技术。既然是服务,就要有基本性能保障、持续提供服务的能力、安全稳定,而且价格要低。服务能力是综合能力,不是某一项单一指标。

某一次考试第一、或者几次考试都拿第一的同学,最后的人生未必最成功。反而是那个成绩中等、发展均衡的同学,更可能成为最后的赢家。人工智能也是如此,最后胜出的,一定是实力均衡、综合能力强大的服务体系。

其实今天不仅中国企业要用我们自己的大模型,美国人工智能企业也想来用中国的大模型了。性能不差,服务又好,最关键是价格便宜,这谁能挡得住?当然我也知道,有人不服气,说美国的大模型也能降价,那就让它降给我们看看吧。