DeepSeek连续三日出现服务故障

发布时间：2026-03-31 21:55阅读：10

DeepSeek在过去三天里遭遇了服务异常。

3月31日17时，话题“DeepSeek崩溃”再次登上热搜。DeepSeek的官方网站显示，3月29日至31日期间，DeepSeek的服务出现了不同程度的问题，包括网页对话、应用程序和API等。这些问题分别持续了约1小时48分钟、10小时13分钟和1小时3分钟。根据官方状态页面的记录，三次故障均已解决，所有服务现已恢复正常。

据经济观察报报道，一位模型技术社区的负责人透露，自2026年2月以来，尽管经历了多个预期发布窗口，DeepSeek仍未正式推出V4版本。当市场期待这款新产品时，却迎来了DeepSeek成立以来最长的一次服务中断。

多位国产模型供应商推测，此次只有面向消费者的DeepSeek产品受到影响，可能是因为在模型迭代过程中进行了灰度测试。

上述技术社区负责人认为，DeepSeek已准备好基础设施以测试V4版本。3月初，DeepSeek的网页端更新显示，代码能力和上下文处理均有所提升，业界猜测这可能是V4版本的隐蔽测试。

一位与多家模型厂商合作的供应商对此有自己的见解：DeepSeek计划在4月正式发布V4之前，提前向消费者群体开放产品测试，以确保新增的“原生推理层”在应对高并发请求时的稳定性。

3月30日，DeepSeek的技术团队解决了服务中断的问题，但在官方API文档中并未提及V4模型的ID。

这些供应商分析，DeepSeek在追求更高性能架构的过程中，扩展了百万Tokens级别的推理能力，暴露出其基础设施建设的不足。新旧架构在底层存储聚合层出现了冲突。

2026年1月27日，DeepSeek发布了全新的DeepSeek-OCR 2模型，采用了创新的DeepEncoder V2方法，使AI能够像人类一样按逻辑顺序“看”图像。这项技术的核心在于改变了传统AI处理图像的方式。DeepEncoder V2让AI基于图像含义动态重新排列图像片段，而不是传统的从左到右刚性扫描。这种方法模仿了人类追随场景逻辑流的方式。

根据DeepSeek公布的技术报告，DeepSeek-OCR 2在多项关键指标上表现出色。在OmniDocBench v1.5基准测试中，该模型达到了91.09%的成绩，比前一代DeepSeek-OCR提升了3.73%。

特别值得一提的是，该模型在保持高精度的同时，严格控制了计算成本，其视觉Token数量限制在256至1120之间，与Google的Gemini-3 Pro相同。在实际应用中，该模型在处理在线用户日志和PDF预训练数据时的重复率分别降低了2.08%和0.81%，展示了其高度的实用性。

根据DeepSeek公布的技术报告，现有的视觉语言模型（VLMs）通常采用固定的光栅扫描顺序处理图像切片，即机械地从左上角扫描至右下角。DeepSeek团队指出，这种方式引入了不必要的归纳偏差，与人类视觉感知相悖。人类在阅读复杂文档、表格或追踪螺旋线条时，视线是由语义理解驱动的“因果流”，后一次注视往往因果依赖于前一次注视，而非单纯的空间坐标移动。

受此认知机制启发，DeepSeek-OCR 2的核心组件DeepEncoder V2被设计成赋予编码器因果推理能力。通过引入可学习的“因果流查询”（Causal Flow Queries），模型在进入LLM解码器进行内容解释之前，已经在编码阶段对视觉信息进行了智能重排序。这实际上构建了一个两级级联的1D因果推理结构：首先由编码器在语义上重组视觉Token，然后由解码器对有序序列进行自回归推理。

这种设计不仅符合光学文本、表格和公式的非线性布局特征，还有效弥合了2D图像结构与1D语言建模之间的差距。

DeepSeek-OCR 2的发布不仅是一次OCR性能的升级，还具有深远的架构探索意义。DeepEncoder V2初步验证了使用语言模型架构作为视觉编码器的潜力。这种架构天然继承了LLM社区在基础设施优化方面的成果，如混合专家（MoE）架构和高效注意力机制。

DeepSeek团队认为，这为迈向统一的全模态编码器提供了一条有希望的路径。未来，单一编码器可能通过配置特定模态的可学习查询，在同一参数空间内实现对图像、音频和文本的特征提取与压缩。DeepSeek-OCR 2所展示的“两个级联的1D因果推理器”模式，通过将2D理解分解为“阅读逻辑推理”和“视觉任务推理”两个互补子任务，或许代表了实现真正2D推理的一种突破性架构方法。

综合自：深度求索官网、经济观察报、券商中国

← 上一篇：BW Energy达成钻井平台售后回租协议下一篇：INPEX延长印尼LNG合作 →