GPT5.5联手GB200，AI迈入软硬协同竞争期，DeepSeek V4能否突围

发布时间：2026-04-24 13:19阅读：30

GPT-5.5 仅仅是对 Claude 4.7 和 Mythos 近期攻势的一个微调版本，但其背后的战略意图和套路远比表面看起来要深远得多。

GPT-5.5 的出现，预示着前沿模型之间的竞争，已经正式进入了一个全新的时代——模型与芯片的协同设计以及系统层面的竞争。黄仁勋此前便在英伟达内部强制推行 Codex，就在 GPT-5.5 发布之前，英伟达各部门超过 1 万人已经通过 Codex 亲身体验了它的强大功能。

目前，硅谷每家科技大厂、每家前沿 AI 实验室，都在全力打造属于自己的智能体编码工具，因为利用 AI 来研发 AI、利用 AI 来提升整体效率，将成为决定未来竞争胜负的关键因素。所以，最近谷歌的创始人都跳出来，要求建立突击队来迎头赶上 Claude Code。而马斯克则与 Cursor 达成了价值 600 亿美元的收购权交易——微软也曾动过类似的念头。

谷歌再次亮出“红灯”，布林亲自领导编码突击队

2026/4/22 >阅读全文

马斯克亮出算力底牌，成功拿下价值 600 亿美元的 Cursor 收购交易

2026/04/22>阅读全文

OpenAI 与英伟达长期保持紧密的芯片协同设计伙伴关系：OpenAI 为英伟达硬件路线图提供关键反馈，信息；反过来，OpenAI 也能够提前获得新架构的使用权。这种合作关系达到了一个新的里程碑，双方共同构建了首个 10 万 GPU 的 GB200 NVL72 集群，并在多次大规模训练中验证了系统级可靠性，树立了行业新标杆。

“GPT-5.5 正是依托于这一基础设施全力运行的结果。”

OpenAI 指出，Codex 与 GPT-5.5 在协同设计过程中扮演了核心角色，AI 助力优化了底层架构以更好地服务自身。

为了在 GPT-5.4 的延迟水平下运行 GPT-5.5，OpenAI 必须将推理过程重构为一个集成系统，而非零散的优化集合。

GPT-5.5 的设计、训练与运行深度绑定于英伟达的 GB200 和 GB300 NVL72 系统。Codex 协助团队将创意快速转化为可测试的实现方案，涵盖草图绘制、实验流程搭建及优化方向筛选；而 GPT-5.5 则推动了技术栈的关键性改进。

Codex 和 GPT-5.5 在达成性能目标方面功不可没。一项关键改进是负载均衡与分区启发式算法。此前，请求按固定块分割以平衡 GPU 核心负载，但静态块数难以适应所有流量。Codex 通过分析数周的生产流量数据，编写了自定义算法来优化负载分区，这使 token 生成速度提升了 20% 以上。

英伟达企业 AI 副总裁 Justin Boitano 强调了协同设计带来的效率飞跃：

“调试时间从数天缩减至数小时，将复杂代码库中数周的实验成果在数小时内转化为进展。这不仅是编码速度的提升，更是一种全新的工作模式，能让人以截然不同的速度推进工作。”

为构建下一代 AI 基础设施，OpenAI 已承诺部署 10 吉瓦的英伟达系统，未来几年其模型训练与推理将依托数百万颗英伟达 GPU 运行。

重视开放权重的英伟达将 OpenAI 的 gpt-oss 模型纳入生态，优化了 TensorRT-LLM 及 vLLM、Ollama 等框架的模型权重。

英伟达与 OpenAI 十余年的深度合作，意味着黄仁勋将全力支持 OpenAI 对抗 Anthropic。

被黄仁纳并的 Groq 创始人 Jonathan Ross 也将 GPT-5.5 的成功归功于英伟达 GB200 NVL72 集群，“功不可没！”

就在昨日，谷歌云在 Next 活动上发布了第八代 TPU：8t 用于训练，8i 用于推理。这是为下一代 Gemini 打造的，通过训推分离直接挑战通用 GPU，也间接“羞辱”了号称 LPU 和 TPU 双料创始人的 Ross。

谷歌 TPU 8t/8i，训推分离策略与黄仁勋“针锋相对”

2026/4/23>阅读全文学

去年底，第六代 TPU 训练出的 Gemini 3 曾碾压 GPT-5，如今英伟达借助 GB200/300 和 GPT-5.5 寻求复仇。预计 8t/8i 将全面挑战 Vera Rubin/LPU 在训练和推理上的表现。

那么，GPT-5.5 成功翻盘了吗？业界注意到打榜分数多是与 Claude-4.7 对比，而“大魔头” Mythos 则神秘地躲在“玻璃门”后。

可以看出 GPT-5.5 在软件工程 SWE-Bench-Pro 评测中仍落后，但在终端智能体 TerminalBench 2.0 和网络安全智能体 CyberGym 上表现优异。

换言之，GPT-5.5 在真实开源代码库的长链条软件工程任务上并非顶尖，但在终端连续操作、网络安全攻防/漏洞分析等更偏向智能体、环境交互和实战的评测中表现强劲，其强项在于工具使用、环境操作和安全任务处理。

GPT-5.5 体现的 token 经济学使其不仅更智能，且解决问题的效率更高，往往能以更少的 token 和重试次数获得更高质量的输出。在人工智能分析编码指数（AIA）中，GPT-5.5 以竞争对手一半的成本提供了最先进的智能。

在谷歌宣称 75% 代码由 AI 生成后，OpenAI 也宣布超过 85% 的员工使用 Codex，覆盖软件工程、财务、沟通、营销、数据科学和产品管理等所有部门。

在沟通部门，团队利用 GPT-5.5 分析半年演讲请求数据，构建风险评估框架，并验证了自动处理低风险请求的 Slack 智能体；财务部门审核了 24,771 份 K-1 税表，通过剔除个人信息的工作流程，比上一年节省了两周时间；市场团队则通过自动化报告生成，每周节省 5-10 小时。

甚至有 OpenAI 研究科学家分享了他仅通过口述指令让 5.5 执行任务，自己与“朋友和男友”共度周末的经历。

“假期中，我仅向 5.5 口述了几分钟，描述了一个极具野心的强化学习训练项目。发送后我便将其抛诸脑后，与朋友及男友欢度数日。周一归来时，一个工业级的强化学习训练任务已在后台运行，持续了 31 个小时。”

那么，在这个周末之后，轮到我们的 DeepSeek V4 登场了？我们也期待它与中国自主芯片系统的协同设计，能带来更多的惊喜。

参考：

https://openai.com/index/introducing-gpt-5-5/

https://blogs.nvidia.com/blog/openai-codex-gpt-5-5-ai-agents/?linkId=100000419058977

← 上一篇：GPT-5.5 亮相：OpenAI 让 Codex 从“代码生成器”进阶为“实干智能体” 下一篇：AI赋能小学英语：教学评一体化实施路径探索 →