标签
英伟达新支持DeepSeek-V4,开箱推理速度破150 tokens/s

英伟达新支持DeepSeek-V4,开箱推理速度破150 tokens/s

IT之家 4 月 25 日消息,英伟达今日(4 月 25 日)通过博文宣布,其NVIDIA Blackwell平台已成功兼容DeepSeek-V4-Pro与DeepSeek-V4-Flash两款模型,开发者能够通过NVIDIA NIM微服务进行下载部署,也可借助SGLang与vLLM框架实现个性化推理。 英伟达在公告中表示,DeepSeek-V4-Pro具备1.6T总参数和49B激活参数,专为高级推理任务设计;而DeepSeek-V4-Flash版本则拥有284B总参数和13B激活参数,主打高速高效特性。

2026-04-25 20:03:44  |  5 阅读
DeepSeek V4平静发布,背后藏着更大的局

DeepSeek V4平静发布,背后藏着更大的局

2025年伊始,DeepSeek凭借R1模型制造了一个震撼性时刻。 那次发布的影响从硅谷扩散至华尔街,英伟达单日市值蒸发6000亿美元,黄仁勋的财富缩水速度比他签名皮夹克还快。全球科技媒体沉默三天后,用同一个词形容所见:震撼。 一年多过去,DeepSeek再次推出新旗舰,这次命名为V4。 但这次,没有市值蒸发,没有集体失语,中芯国际(110.960, 4.98, 4.70%)股价上涨12%,华虹上涨19%,智谱下跌10%——市场的反应精准、克制且职业化,如同早已预判对手牌面,从容收回筹码。 这揭示了一个事

2026-04-25 18:12:38  |  6 阅读

AI晨报:2026年4月25日重大事件盘点

① Claude Code推出Routines功能:关机状态下也能编写代码Anthropic于4月15日对Claude Code进行了全面重构,正式上线Routines(常规任务)特性。用户可以配置一个自动化作业——包含提示词、代码仓库和连接器——并通过定时触发器、API调用或GitHub事件三种方式启动。简单来说,你在睡前设定好任务,第二天早上就能看到结果。这标志着AI编程工具从“你写我用”正式过渡到“你睡它干”的新阶段。② Cursor升级AI Agent:能够自动测试自身生成的代码Cursor在4月

2026-04-25 14:22:15  |  6 阅读
海外评测解析DeepSeek-V4:开源智能体任务夺魁,幻觉增加,Token耗费较高

海外评测解析DeepSeek-V4:开源智能体任务夺魁,幻觉增加,Token耗费较高

每经编辑|兰素英 4月24日,DeepSeek-V4预览版正式发布并开源,声称在代理能力、世界知识和推理性能三大维度达到国内及开源领域的领先水平。 DeepSeek-V4提供Pro和Flash两个版本,均支持百万(1M)Token超长上下文。 两个版本均显著降低了对计算和显存的要求,将每个标记的推理FLOP削减73%,并将KV缓存内存占用减少90%。 4月24日,全球最大AI模型API聚合平台OpenRouter的数据显示,V4-Flash的调用量达270亿Token,V4-Pro为47.9亿Token,

2026-04-25 14:20:15  |  6 阅读
高盛研报:腾讯维持买入评级 目标价700港元

高盛研报:腾讯维持买入评级 目标价700港元

新浪财经全球资本峰会金曜奖投票启动!挖掘最具价值的资本力量,你的一票,至关重要 点击投票 高盛发布研报,决定维持对腾讯控股(494.8, -0.40, -0.08%)(00700)“买入”评级,并将目标价定在700港元。虽然腾讯今年全年的利润增长有所放缓,但该行预计公司今年第一季度及全年的经调整经营溢利将分别实现10%和8%的同比增长。 腾讯推出了开源Hy3 preview语言模型,这是集团在AI战略重组后的首个实质成果,其性能表现和对智能体功能的侧重基本达到了预期。该模型由首席AI科学家姚顺雨(前Ope

2026-04-25 10:41:42  |  4 阅读
大摩力挺腾讯 目标价650港元 给予增持评级

大摩力挺腾讯 目标价650港元 给予增持评级

摩根士丹利发表研究报告指出,腾讯控股(00700)在昨日(23日)正式推出并开放源代码的全新大语言模型Hy3 Preview,标志着其混元(HY)基础模型重构的开端。该模型采用MoE架构,融合快慢双思维模式,总参数规模达2950亿(激活参数210亿),上下文长度支持256K,在复杂推理、指令理解、上下文学习、代码编写、智能体功能及推理效能等多个维度实现优化。大摩据此给予腾讯"增持"投资评级,目标价位定于650港元。 大摩分析认为,Hy3 Preview在代码创作与智能体功能层面实现明显突破,SWE-Ben

2026-04-25 10:40:41  |  6 阅读

孟晚舟谈AI:人类历史终局的技术变革

关山初度尘未洗,策马扬鞭再奋蹄。2025年,华为全员锁定目标,持续攻坚,全年营收达到8,809亿元。联接业务抵御了周期波动;计算业务紧抓AI机遇;终端业务克服困难,鸿蒙生态突破体验瓶颈;数字能源坚持品质第一;华为云聚焦核心业务提升竞争力;智能汽车方案迅速发展。感激客户的信赖与消费者的选择,你们的评价与建议皆是前行动力;感谢全球供应商、伙伴及开发者,协同同行让我们预见生态繁荣;致谢每一位员工的奉献,你们以坚韧克服困境,以专业创造价值,以热爱彼此激励;感谢家属的支持,你们的默默守护是华为员工最坚实的后盾。纵有

2026-04-25 09:59:30  |  5 阅读

开源数据标注平台:AI时代的黄金机遇

开源标注平台崛起!AI时代的新蓝海:数据标注产业!把握先机源码获取项目地址:https://www.gitcc.com/stegosaurus/stegosaurus-label配备完善的汉化界面与本土化特性。支持多元化数据标注具备项目管控能力拥有数据治理功能当前AI技术迅猛演进,数据标注俨然成为驱动智能模型训练的"核心能源库",其战略地位持续攀升。数据显示,2025年国内数据标注产业规模已逾越120亿大关,预期2027年将冲刺200亿规模,年均复合增速超越20%。自动驾驶、医疗智能、工业检测等行业对精准

2026-04-25 09:33:33  |  6 阅读

国内AI智能体技术演进与开发路径

AI 智能体正经历从“聊天机器人”向“自主执行者”的快速演进。到 2026 年,国内技术生态已形成以底层大模型为支撑、中层框架为核心、上层低代码平台为触达的完整体系。国内 AI 智能体开发涉及以下核心技术点:国内主流智能体通常遵循“大脑 + 感知 + 记忆 + 行动”的技术闭环。大脑(LLM 推理能力):国内厂商如DeepSeek、智谱 AI (GLM)、字节跳动 (豆包/云雀)以及月之暗面 (Kimi)提供的模型,在长文本处理和推理效率上具备优势。特别是 DeepSeek 的稀疏架构(MoE)技术,大幅

2026-04-25 08:18:06  |  5 阅读

4·24 AI奇点:技术、开源与监管的三重奏

未来的历史在记载2026年4月24日时,不会仅仅将其描述为“AI史上最震撼的24小时”,而是会将其定位为人類文明演进的关键转折点。在这短短一天内,技术革新、开源浪潮与监管框架三条主线同步抵达历史性拐点,三股势能交汇碰撞、彼此制衡,共同为人工智能未来十年乃至百年的发展奠定了不可逆转的根基。这并非巧合性的“巨头混战”,而是人工智能演进至临界阶段的必然结果。OpenAI的GPT-5.5、DeepSeek的V4、欧盟AI法案,这三个看似孤立的事件,实则构成了一个稳固的三角结构,勾勒出未来AI发展的基本范式。一、G

2026-04-25 04:04:31  |  13 阅读

AI领域第三期精选速递

推荐文章1、年度热门开源Agent方案,探索智能体自主演进路径链接:https://mp.weixin.qq.com/s/Jg1icaZ-W77yupIXcF6Q_A推荐原因:该文深入剖析了自主进化机制,为团队指明了突破方向,从实践层面建议聚焦上下文优化2、智能体时代下的知识管理创新思路链接:https://mp.weixin.qq.com/s/lVn1oqo1ciIlVUoqJA0Hpg推荐原因:虽未深究技术细节,但其核心理念对应用层极具启发性,知识将成为核心运营要素3、GPT Image 2.0顶级提

2026-04-25 02:02:19  |  6 阅读

易鑫集团AI战略进阶:Harness治理体系驱动行业创新

【核心看点】 峰会动态:2026年4月13-14日,香港,2026世界互联网大会亚太峰会,易鑫集团连续两年亮相 公司概况:股票代码(02858.HK),业务遍布国内340+城市及新加坡、马来西亚等海外区域,累计服务客户超1500万 战略演进:易鑫宣布AI战略从"模型中心"转向"体系治理",推出自主研发Harness治理框架。 开放规划:年内将开放部分AI Infra(基础设施),促进金融业AI规模化、安全化落地。 应用成效:自研Agentic大模型已实现全业务流程覆盖,Agent自主交付占比达65%,转化

2026-04-25 00:13:11  |  5 阅读

深度求索V4亮相,昇腾芯片实现全面兼容

国内AI企业深度求索在4月24日隆重推出新一代模型DeepSeek-V4的预览版且一并开放源代码,此模型已深度适配华为昇腾等国产处理器,象征着中国人工智能产业在降低对英伟达CUDA体系依赖方面取得重要进展。模型性能可匹敌国际一流闭源产品DeepSeek-V4涵盖旗舰款V4-Pro与实惠型V4-Flash两种版本,两者均具备百万级token长文本处理能力。其中V4-Pro整体参数量高达1.6万亿,单次推理仅调用490亿参数,在数学、STEM学科及编程竞赛测试中力压所有已公开评估的开源竞品,全球知识测评成绩仅

2026-04-24 23:58:26  |  6 阅读

AI开源协议的法律约束力--企业应用开源模型的合规要点

笔者观察到,相关共识已明确要求参与企业必须在授权范围内规范地运用、调整、二次开发及商业化部署。这表明:开放源代码并非无偿馈赠,依规使用开源人工智能模型,已从单纯的技术考量转化为严肃的法律议题。作为一位深耕科技与法律交叉领域的执业律师,笔者今日欲探讨:企业在部署开源AI模型时,究竟应警惕哪些潜在法律隐患?开源许可协议(Open Source License),实质上是软件创作者以法律契约方式,向他人赋予运用、调整及再传播其创作成果的系列权限。相较于传统著作权“权利悉数保留”的模式,开源协议的核心理念在于“让

2026-04-24 23:43:02  |  5 阅读
杀疯了!DeepSeek V4将百万上下文压至2毛,联手华为昇腾,国产算力要掀桌子?

杀疯了!DeepSeek V4将百万上下文压至2毛,联手华为昇腾,国产算力要掀桌子?

文丨《BUG》栏目 周文猛 DeepSeek-V4预览版,正式亮相了。 今日,DeepSeek官方正式宣布:具备百万字超长上下文理解能力的deepseek-v4-pro与deepseek-v4-flash两款模型已上线并开源,即日起用户可通过官网或官方App体验最新版DeepSeek-V4对话功能,感受1M(百万)级超长上下文记忆的新突破,API服务也已同步升级。 根据官方公布的基准测试结果,在上下文处理、知识储备、逻辑推理及智能体等核心能力上,DeepSeek V4的性能已可与国际顶尖闭源模型相媲美,达

2026-04-24 19:01:17  |  7 阅读