标签

大模型“疯狂星期五”:两种路线的较量

发布时间:2026-04-28 21:08来源:微信阅读:4

2026 年 4 月 24 日凌晨,OpenAI 正式发布 GPT-5.5。

短短数小时后,杭州的深度求索也同步放出了 DeepSeek V4。

同一时间,全球顶尖两款大模型正面“交手”。一边走闭源高端路线,API 定价上调;另一边选择直接开源,价格仅为对手的约七分之一。

媒体因此将这一天称作 AI 的"疯狂星期五"。

但如果你只盯着"中美对决"的表面热度,可能会忽略更关键的信号。

OpenAI 的选择:更贵,但更强的智能

GPT-5.5 并非简单的小幅升级,而是以全新方式训练出来的基础模型。

它的押注方向非常明确:Agent 智能体能力。

直白点说,就是让 AI 不再只停留在回答问题,而是能够自行规划并把任务执行下去:写代码、操控软件、跨应用协同、跑测试,形成一套完整流程。

表现到底到什么程度?在 Expert-SWE 评测中,GPT-5.5 能端到端修复一个人类工程师往往需要 20 小时才能完成的长周期工程任务。Terminal-Bench 2.0 的准确率为 82.7%,SWE-Bench Pro 达到 58.6%。

能力提升带来了价格同步上调。

GPT-5.5 标准版 API:输入每百万 token 5 美元,输出 30 美元。与上一代相比,整体费用大约翻了一倍。

OpenAI 的逻辑很清楚:我拿出更强的能力,你为拿到结果付费。

DeepSeek 的回应:更便宜,却同样能用的智能

DeepSeek V4 的发布策略几乎与 GPT-5.5 背道而驰。

先看架构。V4 采用 1.6 万亿参数的 MoE(混合专家)结构,并提供 Pro 与 Flash 两个版本。

V4-Pro:总参数 1.6 万亿,激活 490 亿,走的是旗舰性能路线。

V4-Flash:总参数 2840 亿,激活 130 亿,更侧重成本与效率。

两种版本的共同点是:全系都配备 100 万 token 量级的上下文窗口。

换句话说,你可以一次性输入大约 75 万字的材料,让模型基于全部内容完成分析与回答。

随后是开源策略。V4 按 MIT 协议完全开放,任何人都能获取模型权重,商用也没有额外限制。

最后再看价格。V4-Pro 的输入成本大致只有 GPT-5.5 标准版的七分之一。

同时,KV 缓存占用仅为上一代的 10%,从而显著提升推理效率。

DeepSeek 的逻辑同样直截了当:把顶级能力做成基础设施,让更多人能直接用起来。

两条路线,指向同一个问题

两款模型在同一天发布,表面是技术层面的比拼,背后其实是 AI 产业发展路径的选择。

OpenAI 采用的是"闭源服务"模式:把最先进的模型握在手里,再通过 API 与产品收费,进而把握体验与质量。

DeepSeek 则走"开源生态"路线:将模型能力对外开放,依靠生态繁荣与规模效应来赢得增长。

这两条路并不存在绝对的对错。

闭源模式的优势在于迭代快、体验一致、风险可控。代价是更高的价格门槛会把不少中小开发者和企业挡在门外。

开源模式的好处是成本更低、生态扩张更快、创新节奏也更快。与此同时,模型被二次利用后的安全与合规挑战也更突出。

而这一点,已经不再只是推测。

AI 安全的警报已经拉响

就在 GPT-5.5 发布前三天,美国佛罗里达州检察官宣布将对 OpenAI 及 ChatGPT 启动刑事调查。

案件导火索是一桩发生在 2025 年 4 月的校园枪击事件。

检方表示,嫌疑人在案发前曾与 ChatGPT 进行对话,ChatGPT 向其推荐了武器与弹药,并进一步给出了可能造成最大伤害的作案时间与地点。

这是美国刑事司法史上首次针对 AI 公司展开刑事调查。

无论最终调查结论如何,这个信号都足够清晰:AI 能力的边界问题,正在从"技术讨论"走向"法律问题"。

模型越强,所承担的安全责任就越重。

开源模型同样面临类似挑战。当任何人都能下载顶级大模型并自由使用时,怎样避免被滥用?

这同样是所有 AI 从业者必须面对的现实,无论选择哪种路线。

中国 AI 的另一张成绩单

把视线拉回国内。除了大模型竞争之外,中国 AI 产业的另一条线也在加速铺开。

4 月 27 日,广东省举办人工智能应用对接大会,并公布了一组数据:2025 年广东 AI 核心产业规模突破 3000 亿元,同比增长超过 40%,占全国约四分之一。

作为"世界工厂",广东拥有 10 个万亿级产业集群,智能手机产量占全国 40% 以上。这些产业正被 AI 持续改造。

同一天,摩尔线程宣布其旗舰 GPU MTT S5000 已完成对中国移动自研九天 35B 大模型的全流程适配。这也是国产 GPU 首次支撑央企大模型规模化落地。

4 月 26 日恰逢世界知识产权日。国家知识产权局公布:我国拥有全球约 60% 的人工智能专利,以及约三分之二的机器人相关专利。

从模型层到应用层,从芯片到产业落地,中国 AI 正在逐步形成更完整的链条。

真正的战场已在转移

回到 4 月 24 日这一天。

GPT-5.5 与 DeepSeek V4 同日发布,意味着 AI 产业竞争的关注点正在发生变化。

过去两年,外界最关心的是"谁的模型更强"。

如今,问题逐渐变成了"谁能把 AI 更好地用起来"。

当模型能力加速普及,技术门槛也在快速降低。百万 token 上下文、Agent 自主执行、多模态理解等能力,正在从实验室走向日常,成为开发者与企业手边的常用工具。

对企业而言,当前更需要思考的并不是"要不要用 AI",而是"用 AI 解决什么具体问题"。

对个人来说,AI 在写代码、做研究、处理数据方面的效率已明显超过以往。关键在于找到适合自己的使用场景,而不是担心被替代。

在 4 月 24 日之后,AI 真正的竞争战场已经从"有没有"转向"怎么用"。

这个窗口期不会太久。

数据