标签

GPT5.5联手GB200,AI迈入软硬协同竞争期,DeepSeek V4能否突围

发布时间:2026-04-24 13:19来源:微信阅读:6

GPT-5.5 仅仅是对 Claude 4.7 和 Mythos 近期攻势的一个微调版本,但其背后的战略意图和套路远比表面看起来要深远得多。

GPT-5.5 的出现,预示着前沿模型之间的竞争,已经正式进入了一个全新的时代——模型与芯片的协同设计以及系统层面的竞争。黄仁勋此前便在英伟达内部强制推行 Codex,就在 GPT-5.5 发布之前,英伟达各部门超过 1 万人已经通过 Codex 亲身体验了它的强大功能。

目前,硅谷每家科技大厂、每家前沿 AI 实验室,都在全力打造属于自己的智能体编码工具,因为利用 AI 来研发 AI、利用 AI 来提升整体效率,将成为决定未来竞争胜负的关键因素。所以,最近谷歌的创始人都跳出来,要求建立突击队来迎头赶上 Claude Code。而马斯克则与 Cursor 达成了价值 600 亿美元的收购权交易——微软也曾动过类似的念头。

谷歌再次亮出“红灯”,布林亲自领导编码突击队

2026/4/22 >阅读全文

马斯克亮出算力底牌,成功拿下价值 600 亿美元的 Cursor 收购交易

2026/04/22>阅读全文

OpenAI 与英伟达长期保持紧密的芯片协同设计伙伴关系:OpenAI 为英伟达硬件路线图提供关键反馈,信息;反过来,OpenAI 也能够提前获得新架构的使用权。这种合作关系达到了一个新的里程碑,双方共同构建了首个 10 万 GPU 的 GB200 NVL72 集群,并在多次大规模训练中验证了系统级可靠性,树立了行业新标杆。

“GPT-5.5 正是依托于这一基础设施全力运行的结果。”

OpenAI 指出,Codex 与 GPT-5.5 在协同设计过程中扮演了核心角色,AI 助力优化了底层架构以更好地服务自身。

为了在 GPT-5.4 的延迟水平下运行 GPT-5.5,OpenAI 必须将推理过程重构为一个集成系统,而非零散的优化集合。

GPT-5.5 的设计、训练与运行深度绑定于英伟达的 GB200 和 GB300 NVL72 系统。Codex 协助团队将创意快速转化为可测试的实现方案,涵盖草图绘制、实验流程搭建及优化方向筛选;而 GPT-5.5 则推动了技术栈的关键性改进。

Codex 和 GPT-5.5 在达成性能目标方面功不可没。一项关键改进是负载均衡与分区启发式算法。此前,请求按固定块分割以平衡 GPU 核心负载,但静态块数难以适应所有流量。Codex 通过分析数周的生产流量数据,编写了自定义算法来优化负载分区,这使 token 生成速度提升了 20% 以上。

英伟达企业 AI 副总裁 Justin Boitano 强调了协同设计带来的效率飞跃:

“调试时间从数天缩减至数小时,将复杂代码库中数周的实验成果在数小时内转化为进展。这不仅是编码速度的提升,更是一种全新的工作模式,能让人以截然不同的速度推进工作。”

为构建下一代 AI 基础设施,OpenAI 已承诺部署 10 吉瓦的英伟达系统,未来几年其模型训练与推理将依托数百万颗英伟达 GPU 运行。

重视开放权重的英伟达将 OpenAI 的 gpt-oss 模型纳入生态,优化了 TensorRT-LLM 及 vLLM、Ollama 等框架的模型权重。

英伟达与 OpenAI 十余年的深度合作,意味着黄仁勋将全力支持 OpenAI 对抗 Anthropic。

被黄仁纳并的 Groq 创始人 Jonathan Ross 也将 GPT-5.5 的成功归功于英伟达 GB200 NVL72 集群,“功不可没!”

就在昨日,谷歌云在 Next 活动上发布了第八代 TPU:8t 用于训练,8i 用于推理。这是为下一代 Gemini 打造的,通过训推分离直接挑战通用 GPU,也间接“羞辱”了号称 LPU 和 TPU 双料创始人的 Ross。

谷歌 TPU 8t/8i,训推分离策略与黄仁勋“针锋相对”

2026/4/23>阅读全文学

去年底,第六代 TPU 训练出的 Gemini 3 曾碾压 GPT-5,如今英伟达借助 GB200/300 和 GPT-5.5 寻求复仇。预计 8t/8i 将全面挑战 Vera Rubin/LPU 在训练和推理上的表现。

那么,GPT-5.5 成功翻盘了吗?业界注意到打榜分数多是与 Claude-4.7 对比,而“大魔头” Mythos 则神秘地躲在“玻璃门”后。

可以看出 GPT-5.5 在软件工程 SWE-Bench-Pro 评测中仍落后,但在终端智能体 TerminalBench 2.0 和网络安全智能体 CyberGym 上表现优异。

换言之,GPT-5.5 在真实开源代码库的长链条软件工程任务上并非顶尖,但在终端连续操作、网络安全攻防/漏洞分析等更偏向智能体、环境交互和实战的评测中表现强劲,其强项在于工具使用、环境操作和安全任务处理。

GPT-5.5 体现的 token 经济学使其不仅更智能,且解决问题的效率更高,往往能以更少的 token 和重试次数获得更高质量的输出。在人工智能分析编码指数(AIA)中,GPT-5.5 以竞争对手一半的成本提供了最先进的智能。

在谷歌宣称 75% 代码由 AI 生成后,OpenAI 也宣布超过 85% 的员工使用 Codex,覆盖软件工程、财务、沟通、营销、数据科学和产品管理等所有部门。

在沟通部门,团队利用 GPT-5.5 分析半年演讲请求数据,构建风险评估框架,并验证了自动处理低风险请求的 Slack 智能体;财务部门审核了 24,771 份 K-1 税表,通过剔除个人信息的工作流程,比上一年节省了两周时间;市场团队则通过自动化报告生成,每周节省 5-10 小时。

甚至有 OpenAI 研究科学家分享了他仅通过口述指令让 5.5 执行任务,自己与“朋友和男友”共度周末的经历。

“假期中,我仅向 5.5 口述了几分钟,描述了一个极具野心的强化学习训练项目。发送后我便将其抛诸脑后,与朋友及男友欢度数日。周一归来时,一个工业级的强化学习训练任务已在后台运行,持续了 31 个小时。”

那么,在这个周末之后,轮到我们的 DeepSeek V4 登场了?我们也期待它与中国自主芯片系统的协同设计,能带来更多的惊喜。

--

参考:

https://openai.com/index/introducing-gpt-5-5/

https://blogs.nvidia.com/blog/openai-codex-gpt-5-5-ai-agents/?linkId=100000419058977