大模型“疯狂星期五”：两种路线的较量

发布时间：2026-04-28 21:08阅读：9

2026 年 4 月 24 日凌晨，OpenAI 正式发布 GPT-5.5。

短短数小时后，杭州的深度求索也同步放出了 DeepSeek V4。

同一时间，全球顶尖两款大模型正面“交手”。一边走闭源高端路线，API 定价上调；另一边选择直接开源，价格仅为对手的约七分之一。

媒体因此将这一天称作 AI 的"疯狂星期五"。

但如果你只盯着"中美对决"的表面热度，可能会忽略更关键的信号。

OpenAI 的选择：更贵，但更强的智能

GPT-5.5 并非简单的小幅升级，而是以全新方式训练出来的基础模型。

它的押注方向非常明确：Agent 智能体能力。

直白点说，就是让 AI 不再只停留在回答问题，而是能够自行规划并把任务执行下去：写代码、操控软件、跨应用协同、跑测试，形成一套完整流程。

表现到底到什么程度？在 Expert-SWE 评测中，GPT-5.5 能端到端修复一个人类工程师往往需要 20 小时才能完成的长周期工程任务。Terminal-Bench 2.0 的准确率为 82.7%，SWE-Bench Pro 达到 58.6%。

能力提升带来了价格同步上调。

GPT-5.5 标准版 API：输入每百万 token 5 美元，输出 30 美元。与上一代相比，整体费用大约翻了一倍。

OpenAI 的逻辑很清楚：我拿出更强的能力，你为拿到结果付费。

DeepSeek 的回应：更便宜，却同样能用的智能

DeepSeek V4 的发布策略几乎与 GPT-5.5 背道而驰。

先看架构。V4 采用 1.6 万亿参数的 MoE（混合专家）结构，并提供 Pro 与 Flash 两个版本。

V4-Pro：总参数 1.6 万亿，激活 490 亿，走的是旗舰性能路线。

V4-Flash：总参数 2840 亿，激活 130 亿，更侧重成本与效率。

两种版本的共同点是：全系都配备 100 万 token 量级的上下文窗口。

换句话说，你可以一次性输入大约 75 万字的材料，让模型基于全部内容完成分析与回答。

随后是开源策略。V4 按 MIT 协议完全开放，任何人都能获取模型权重，商用也没有额外限制。

最后再看价格。V4-Pro 的输入成本大致只有 GPT-5.5 标准版的七分之一。

同时，KV 缓存占用仅为上一代的 10%，从而显著提升推理效率。

DeepSeek 的逻辑同样直截了当：把顶级能力做成基础设施，让更多人能直接用起来。

两条路线，指向同一个问题

两款模型在同一天发布，表面是技术层面的比拼，背后其实是 AI 产业发展路径的选择。

OpenAI 采用的是"闭源服务"模式：把最先进的模型握在手里，再通过 API 与产品收费，进而把握体验与质量。

DeepSeek 则走"开源生态"路线：将模型能力对外开放，依靠生态繁荣与规模效应来赢得增长。

这两条路并不存在绝对的对错。

闭源模式的优势在于迭代快、体验一致、风险可控。代价是更高的价格门槛会把不少中小开发者和企业挡在门外。

开源模式的好处是成本更低、生态扩张更快、创新节奏也更快。与此同时，模型被二次利用后的安全与合规挑战也更突出。

而这一点，已经不再只是推测。

AI 安全的警报已经拉响

就在 GPT-5.5 发布前三天，美国佛罗里达州检察官宣布将对 OpenAI 及 ChatGPT 启动刑事调查。

案件导火索是一桩发生在 2025 年 4 月的校园枪击事件。

检方表示，嫌疑人在案发前曾与 ChatGPT 进行对话，ChatGPT 向其推荐了武器与弹药，并进一步给出了可能造成最大伤害的作案时间与地点。

这是美国刑事司法史上首次针对 AI 公司展开刑事调查。

无论最终调查结论如何，这个信号都足够清晰：AI 能力的边界问题，正在从"技术讨论"走向"法律问题"。

模型越强，所承担的安全责任就越重。

开源模型同样面临类似挑战。当任何人都能下载顶级大模型并自由使用时，怎样避免被滥用？

这同样是所有 AI 从业者必须面对的现实，无论选择哪种路线。

中国 AI 的另一张成绩单

把视线拉回国内。除了大模型竞争之外，中国 AI 产业的另一条线也在加速铺开。

4 月 27 日，广东省举办人工智能应用对接大会，并公布了一组数据：2025 年广东 AI 核心产业规模突破 3000 亿元，同比增长超过 40%，占全国约四分之一。

作为"世界工厂"，广东拥有 10 个万亿级产业集群，智能手机产量占全国 40% 以上。这些产业正被 AI 持续改造。

同一天，摩尔线程宣布其旗舰 GPU MTT S5000 已完成对中国移动自研九天 35B 大模型的全流程适配。这也是国产 GPU 首次支撑央企大模型规模化落地。

4 月 26 日恰逢世界知识产权日。国家知识产权局公布：我国拥有全球约 60% 的人工智能专利，以及约三分之二的机器人相关专利。

从模型层到应用层，从芯片到产业落地，中国 AI 正在逐步形成更完整的链条。

真正的战场已在转移

回到 4 月 24 日这一天。

GPT-5.5 与 DeepSeek V4 同日发布，意味着 AI 产业竞争的关注点正在发生变化。

过去两年，外界最关心的是"谁的模型更强"。

如今，问题逐渐变成了"谁能把 AI 更好地用起来"。

当模型能力加速普及，技术门槛也在快速降低。百万 token 上下文、Agent 自主执行、多模态理解等能力，正在从实验室走向日常，成为开发者与企业手边的常用工具。

对企业而言，当前更需要思考的并不是"要不要用 AI"，而是"用 AI 解决什么具体问题"。

对个人来说，AI 在写代码、做研究、处理数据方面的效率已明显超过以往。关键在于找到适合自己的使用场景，而不是担心被替代。

在 4 月 24 日之后，AI 真正的竞争战场已经从"有没有"转向"怎么用"。

这个窗口期不会太久。

数据

← 上一篇：AI时代，剪辑师为何仍不可替代？下一篇：AI周报：笑谈智能与人话 →