标签
英伟达新支持DeepSeek-V4,开箱推理速度破150 tokens/s

英伟达新支持DeepSeek-V4,开箱推理速度破150 tokens/s

IT之家 4 月 25 日消息,英伟达今日(4 月 25 日)通过博文宣布,其NVIDIA Blackwell平台已成功兼容DeepSeek-V4-Pro与DeepSeek-V4-Flash两款模型,开发者能够通过NVIDIA NIM微服务进行下载部署,也可借助SGLang与vLLM框架实现个性化推理。 英伟达在公告中表示,DeepSeek-V4-Pro具备1.6T总参数和49B激活参数,专为高级推理任务设计;而DeepSeek-V4-Flash版本则拥有284B总参数和13B激活参数,主打高速高效特性。

2026-04-25 20:03:44  |  5 阅读