标签
英伟达新支持DeepSeek-V4,开箱推理速度破150 tokens/s

英伟达新支持DeepSeek-V4,开箱推理速度破150 tokens/s

IT之家 4 月 25 日消息,英伟达今日(4 月 25 日)通过博文宣布,其NVIDIA Blackwell平台已成功兼容DeepSeek-V4-Pro与DeepSeek-V4-Flash两款模型,开发者能够通过NVIDIA NIM微服务进行下载部署,也可借助SGLang与vLLM框架实现个性化推理。 英伟达在公告中表示,DeepSeek-V4-Pro具备1.6T总参数和49B激活参数,专为高级推理任务设计;而DeepSeek-V4-Flash版本则拥有284B总参数和13B激活参数,主打高速高效特性。

2026-04-25 20:03:44  |  5 阅读

沐曦携手FlagOS与实验室,成功完成DeepSeek-V4 Day0适配

4月24日,沐曦股份与FlagOS达成合作,成功针对DeepSeek最新发布的DeepSeek-V4-Flash模型实现了Day 0级别的快速适配。同一天,沐曦股份还联合上海人工智能实验室的KernelSwift智能算子迁移系统,率先完成了DeepSeek-V4核心算子的Day 0适配工作。截至目前,沐曦股份已迅速完成了针对国内19款主流开源模型的极速适配,全面覆盖了DeepSeek、MiniMax、智谱、阿里巴巴、腾讯、阶跃星辰、百度等头部厂商的最新旗舰模型。适配范围涵盖语言、多模态、OCR及3D生成等

2026-04-25 08:26:50  |  3 阅读