模型适配_标签-酷阅新闻

英伟达新支持DeepSeek-V4，开箱推理速度破150 tokens/s

IT之家 4 月 25 日消息，英伟达今日（4 月 25 日）通过博文宣布，其NVIDIA Blackwell平台已成功兼容DeepSeek-V4-Pro与DeepSeek-V4-Flash两款模型，开发者能够通过NVIDIA NIM微服务进行下载部署，也可借助SGLang与vLLM框架实现个性化推理。英伟达在公告中表示，DeepSeek-V4-Pro具备1.6T总参数和49B激活参数，专为高级推理任务设计；而DeepSeek-V4-Flash版本则拥有284B总参数和13B激活参数，主打高速高效特性。

2026-04-25 20:03:44 | 25 阅读

沐曦携手FlagOS与实验室，成功完成DeepSeek-V4 Day0适配

4月24日，沐曦股份与FlagOS达成合作，成功针对DeepSeek最新发布的DeepSeek-V4-Flash模型实现了Day 0级别的快速适配。同一天，沐曦股份还联合上海人工智能实验室的KernelSwift智能算子迁移系统，率先完成了DeepSeek-V4核心算子的Day 0适配工作。截至目前，沐曦股份已迅速完成了针对国内19款主流开源模型的极速适配，全面覆盖了DeepSeek、MiniMax、智谱、阿里巴巴、腾讯、阶跃星辰、百度等头部厂商的最新旗舰模型。适配范围涵盖语言、多模态、OCR及3D生成等

2026-04-25 08:26:50 | 11 阅读