AI日报【2026-04-25】:DeepSeek V4震撼开源,AI领域迎来新纪元
今日摘要
模型发布1. DeepSeek V4开源:支持百万级Token上下文
融资动态2. 谷歌计划注资Anthropic达400亿美元
模型发布3. OpenAI推出GPT-5.5版本
模型发布4. DeepSeek V4发布,一年后重创美国同行
开源项目5. 开源记忆组件赋予AI代理长期记忆能力
研究论文6. 深度学习有望建立科学理论体系
融资动态7. ComfyUI完成融资,估值攀升至5亿
实用工具8. Karpathy风格LLM Wiki助力AI代理维护
开源项目9. DeepEP高效专家并行通信库上线
中国科技巨头DeepSeek正式上线V4预览版开源模型,宣告开源AI迈入全新阶段。该模型支持百万Token长上下文,包含DeepSeek-V4-Pro(1.6T参数/49B激活)和DeepSeek-V4-Flash(284B参数/13B激活)两个版本,其性能已跻身全球顶尖闭源模型行列。
DeepSeek-V4-Pro在智能体编码基准测试中斩获开源SOTA佳绩,具备丰富的世界知识,并重点优化了代码生成能力,这对AI代理工具的演进至关重要。该模型现已通过chat.deepseek.com的专家/即时模式提供,API接口也已同步更新。
此次发布不仅是中国芯片产业的里程碑,DeepSeek还特别强调了与华为技术的兼容性。继一年前重创美国竞争对手后,V4的发布进一步巩固了中国在开源AI领域的领先优势,为全球开发者带来了更具性价比的高性能AI方案。
编者按:DeepSeek V4的发布不仅是技术层面的角逐,更是开源与闭源AI力量对比的转折点。当中国科技企业能以开源形式提供媲美顶级闭源系统的性能,全球AI开发格局或将迎来重塑。
谷歌打算向Anthropic注资400亿美元,此举将彻底改变AI行业的竞争态势。这笔巨额投资体现了谷歌在AI领域的战略重心转移,旨在借助Anthropic的技术实力来对抗OpenAI等强劲对手。
这笔投资额远超以往任何一笔AI领域交易,凸显了谷歌对Anthropic技术的高度认可,也显示出科技巨头正以前所未有的力度角逐AI基础设施。消息公布后,Anthropic的估值有望突破千亿美元大关。
编者按:谷歌的400亿美元投资不仅是资金注入,更是对Anthropic技术路线的背书。当科技巨头以如此规模押注一家AI公司,传统云计算与AI模型的界限正加速模糊。
OpenAI正式推出了GPT-5.5模型,标志着其旗舰产品线的又一次重大升级。该模型在多项基准测试中超越了前代产品,尤其在复杂推理和代码生成方面表现卓越。
GPT-5.5采用了全新的训练架构,支持更长的上下文窗口,并增强了多模态处理能力。OpenAI表示,新模型在保持对话连贯性方面有显著提升,同时幻觉现象的发生频率也有所降低。该模型将通过ChatGPT和API服务逐步向公众开放。
编者按:GPT-5.5的发布不仅是技术迭代,更是OpenAI在AI安全与能力平衡上的新探索。随着模型规模持续扩张,如何确保输出可靠性成为行业共同面临的挑战。
中国AI企业DeepSeek发布了备受瞩目的V4预览版,宣称该开源模型可与Anthropic、谷歌及OpenAI等美国顶尖闭源系统分庭抗礼。DeepSeek指出V4相比前代有显著提升,尤其在编码能力上,这一能力已成为AI代理的核心,推动了ChatGPT Codex和Claude Code等工具的成功。
此次发布同样是中国芯片产业的重要里程碑,DeepSeek再次强调了与华为技术的兼容性。距离一年前重创美国竞争对手已过去一年,这标志着中国AI技术实力的稳步提升。
编者按:DeepSeek V4的发布再次证明,开源AI正在快速缩小与闭源系统的性能差距。当中国科技企业能以开源形式提供媲美顶级闭源系统的性能,全球AI开发格局或将迎来重塑。
开发者Alash3al推出了名为Stash的开源项目,为各类AI代理赋予持久记忆能力,解决了每次对话都需要重新解释背景的问题。Stash作为一个持久认知层,位于AI代理与世界之间,不替换模型本身,而是赋予模型连续性。
该项目基于PostgreSQL和pgvector构建,支持MCP原生,能将对话转化为事实,事实形成模式,模式最终演化为智慧。Stash采用类似文件夹的命名空间系统,帮助AI将学习内容整理成独立存储桶,解决了记忆混乱难题。开发者可在GitHub获取源码。
编者按:Stash的发布解决了AI长期存在的记忆难题,为个性化AI体验奠定了技术基础。当AI不再需要重复解释背景,人机交互将变得更加自然高效。
一篇新论文提出深度学习将建立科学理论,该文已提交至arXiv,共41页,含6个图表。研究认为随着深度学习的发展,建立其科学理论基础将成为可能,这将帮助理解为何深度学习如此有效以及如何改进它。
论文从统计学和机器学习角度探讨了深度学习的理论基础,为这一快速发展领域提供了理论框架。随着AI模型规模不断扩大,建立科学理论对于指导未来研究和应用开发具有重要意义。
编者按:深度学习科学理论的建立,标志着AI研究从经验驱动向理论驱动的转变。当算法黑箱逐渐打开,AI发展将更加稳健可控。
ComfyUI完成了新一轮融资,估值升至5亿美元。该工具为创作者提供对AI生成图像、视频和音频的更多控制权,近期刚完成3000万美元融资。ComfyUI的崛起反映了创作者对AI生成内容控制权需求的增长。
随着AI生成媒体内容的普及,创作者越来越需要能够精确控制生成过程的工具。ComfyUI提供的节点式工作流让创作者能像编程一样精确控制AI生成过程,满足了专业创作者对AI工具的高要求。
编者按:ComfyUI的估值飙升反映了创作者对AI生成内容控制权的迫切需求。当AI创作工具从自动生成转向精准控制,创作者与AI的关系正在被重新定义。
开发者推出了名为Wuphf的开源项目,创建了一个类似Karpathy风格的LLM Wiki,由AI代理维护,支持Markdown和Git。该项目旨在让Claude、Codex和OpenClaw等AI代理能够协作工作,同时保持上下文不丢失。
Wuphf被描述为AI员工的Slack,具备共享大脑功能,使多个AI能够协作执行任务而不丢失上下文信息。
编者按:Wuphf代表了AI协作工具的新方向,当多个AI能够共享并维护知识库,团队AI将成为可能。这预示着未来工作流程的重大变革。
GitHub热门项目DeepEP是一款高效专家并行通信库,使用Cuda开发,今日新增189个星标。该库旨在优化大规模AI模型训练中的通信效率,特别适用于专家并行架构。