标签

DeepSeek连续三日出现服务故障

发布时间:2026-03-31 21:55来源:新浪新闻阅读:4

DeepSeek在过去三天里遭遇了服务异常。

3月31日17时,话题“DeepSeek崩溃”再次登上热搜。DeepSeek的官方网站显示,3月29日至31日期间,DeepSeek的服务出现了不同程度的问题,包括网页对话、应用程序和API等。这些问题分别持续了约1小时48分钟、10小时13分钟和1小时3分钟。根据官方状态页面的记录,三次故障均已解决,所有服务现已恢复正常。

据经济观察报报道,一位模型技术社区的负责人透露,自2026年2月以来,尽管经历了多个预期发布窗口,DeepSeek仍未正式推出V4版本。当市场期待这款新产品时,却迎来了DeepSeek成立以来最长的一次服务中断。

多位国产模型供应商推测,此次只有面向消费者的DeepSeek产品受到影响,可能是因为在模型迭代过程中进行了灰度测试。

上述技术社区负责人认为,DeepSeek已准备好基础设施以测试V4版本。3月初,DeepSeek的网页端更新显示,代码能力和上下文处理均有所提升,业界猜测这可能是V4版本的隐蔽测试。

一位与多家模型厂商合作的供应商对此有自己的见解:DeepSeek计划在4月正式发布V4之前,提前向消费者群体开放产品测试,以确保新增的“原生推理层”在应对高并发请求时的稳定性。

3月30日,DeepSeek的技术团队解决了服务中断的问题,但在官方API文档中并未提及V4模型的ID。

这些供应商分析,DeepSeek在追求更高性能架构的过程中,扩展了百万Tokens级别的推理能力,暴露出其基础设施建设的不足。新旧架构在底层存储聚合层出现了冲突。

2026年1月27日,DeepSeek发布了全新的DeepSeek-OCR 2模型,采用了创新的DeepEncoder V2方法,使AI能够像人类一样按逻辑顺序“看”图像。这项技术的核心在于改变了传统AI处理图像的方式。DeepEncoder V2让AI基于图像含义动态重新排列图像片段,而不是传统的从左到右刚性扫描。这种方法模仿了人类追随场景逻辑流的方式。

根据DeepSeek公布的技术报告,DeepSeek-OCR 2在多项关键指标上表现出色。在OmniDocBench v1.5基准测试中,该模型达到了91.09%的成绩,比前一代DeepSeek-OCR提升了3.73%。

特别值得一提的是,该模型在保持高精度的同时,严格控制了计算成本,其视觉Token数量限制在256至1120之间,与Google的Gemini-3 Pro相同。在实际应用中,该模型在处理在线用户日志和PDF预训练数据时的重复率分别降低了2.08%和0.81%,展示了其高度的实用性。

根据DeepSeek公布的技术报告,现有的视觉语言模型(VLMs)通常采用固定的光栅扫描顺序处理图像切片,即机械地从左上角扫描至右下角。DeepSeek团队指出,这种方式引入了不必要的归纳偏差,与人类视觉感知相悖。人类在阅读复杂文档、表格或追踪螺旋线条时,视线是由语义理解驱动的“因果流”,后一次注视往往因果依赖于前一次注视,而非单纯的空间坐标移动。

受此认知机制启发,DeepSeek-OCR 2的核心组件DeepEncoder V2被设计成赋予编码器因果推理能力。通过引入可学习的“因果流查询”(Causal Flow Queries),模型在进入LLM解码器进行内容解释之前,已经在编码阶段对视觉信息进行了智能重排序。这实际上构建了一个两级级联的1D因果推理结构:首先由编码器在语义上重组视觉Token,然后由解码器对有序序列进行自回归推理。

这种设计不仅符合光学文本、表格和公式的非线性布局特征,还有效弥合了2D图像结构与1D语言建模之间的差距。

DeepSeek-OCR 2的发布不仅是一次OCR性能的升级,还具有深远的架构探索意义。DeepEncoder V2初步验证了使用语言模型架构作为视觉编码器的潜力。这种架构天然继承了LLM社区在基础设施优化方面的成果,如混合专家(MoE)架构和高效注意力机制。

DeepSeek团队认为,这为迈向统一的全模态编码器提供了一条有希望的路径。未来,单一编码器可能通过配置特定模态的可学习查询,在同一参数空间内实现对图像、音频和文本的特征提取与压缩。DeepSeek-OCR 2所展示的“两个级联的1D因果推理器”模式,通过将2D理解分解为“阅读逻辑推理”和“视觉任务推理”两个互补子任务,或许代表了实现真正2D推理的一种突破性架构方法。

综合自:深度求索官网、经济观察报、券商中国