奥特曼合影竟是AI做的，OpenAI深夜放出图像新王牌

发布时间：2026-04-10 09:52阅读：15

谁都没料到，那张刷爆网络的奥特曼合照，居然是由AI生成的！

就在今天，有大V晒出了一组让人震撼的图片，而这些作品全部来自OpenAI新一代多模态模型GPT-Image-2！

据称，GPT-Image-2的内部代号为GPT-5o/Spud，已在竞技场中悄然亮相。

在完成迭代后，它呈现出了近乎惊人的文本渲染实力，整体表现足以压过Nano Banana Pro。

不管是LOGO创作、YouTube页面截图，还是对版式要求极高的图文排版，GPT-Image-2都能做到近似「像素级」复现。

从已曝光的样张来看，它生成的文字在清晰度和逻辑性上，几乎与真实拍摄无异。

特别是在人物图像生成方面，它已经明显跨过了「恐怖谷」阶段。

眼下，GPT-Image-2几乎刷遍全网，不少人都感叹它「太离谱了」。

看起来，OpenAI这张多模态底牌终于还是藏不住了！

继Nano Banana Pro之后，沉寂许久的「AI生图圈」再次迎来巨震。

去年12月，GPT-Image-1.5强势登场，不但能实现指哪改哪，还是个十足的「细节控」。

仅隔三个多月，GPT-Image-2便迎来了一次近乎「史诗级」的升级。

目前，这一系列模型曾以匿名方式低调出现在Chatbot Arena，随后又很快被下线——

Maskingtape-alpha

Gaffertape-alpha

packingtape-alpha

与前一代相比，GPT-Image-2的提升主要集中在两项极具颠覆性的核心能力上：

其一，它具备极为庞杂的「世界知识」，因此生成出的图像能够更准确地符合现实逻辑和物理常识；

其二，它拥有非常突出的文本渲染能力，基本补齐了传统AI生图在文字拼写与排版上的长期短板。

外界普遍猜测，这正是建立在全新预训练底座上的GPT-5o，其展现出的跨越式提升，绝非4o那种小幅更新可以相提并论。

如今，大量网友正围绕GPT-Image-2展开一场全方位的实测狂潮。

毫不夸张地说，GPT-Image-2在图像生成上的水准，已经对谷歌Nano Banana Pro形成了明显的「降维打击」。

这种极强的空间理解能力与真实质感，让AI生成画面不再带有明显的「塑料感」。

就拿这组宜家外景对比图来说，它在光影细节和透视关系上的表现，几乎到了足以乱真的程度。

曾经，AI生图里的文字处理一直被视作公认的「翻车重灾区」。

很多人想必都还记得，被乱码、多指畸形以及错误世界地图支配的那种尴尬。但如今，这些问题似乎都成了过去式。

现在的GPT-Image-2，已经能够写出相当漂亮的文字。

比如这张YouTube网页截图，整体细节严密贴合，那种像素级的真实感足以让人怀疑是不是截图本身。

再看看这张解剖图，繁复的专业术语标注几乎没有差错，专业度直接拉满。

最让人头皮发麻的，是大V Tz的实际测试：它竟然能写出颇有韵味的中文草书古诗。

这种对复杂汉字结构的掌控能力，强到让人不寒而栗。

设计师的「重武器」已经出现，GPT-Image-2甚至让PS显得像是纯手工时代的工具。

真正让设计圈感到压力陡增的是，GPT-Image-2已经显露出全链路式的设计输出能力。

它不再只是生成一张好看的图片，而是已经能够直接交付接近成品的结果。

无论是复杂精细的Web前端UI，还是逻辑繁复的OS系统界面，它都可以做到近乎像素级的「一步生成」。

这种从创意到原型的极短路径，正在重新定义设计行业的门槛。

甚至连苹果发布会里的OS总览图，它都能复刻得有模有样。

在另一轮测试中，还有人发现GPT-Image-2把「黄色滤镜」问题也解决了。

过去在生成特定构图、应对复杂光影时，AI常常会出现不自然的偏色或者过度磨皮般的平滑感。

但现在，GPT-Image-2已经表现出相当夸张的还原能力。

同时，GPT-Image-2还可以一键生成各类游戏截图。

如果只论人物生成的真实程度，GPT-Image-2已经把标准抬到了新的高度。

看看这张全网刷屏的「奥特曼合照」：皱纹、胡茬、发丝，甚至眼神中的光线细节都被精准还原，几乎看不出任何「AI痕迹」，完全就是现实人物的质感。

此外，对于喜欢二次元风格的用户来说，也算是迎来了好消息。

除了GPT-Image-2之外，OpenAI内部近来的「泄露」也几乎止不住——

这不，关于GPT-6的重磅传闻也已经传得到处都是。

有网友拿到的内部消息显示，这款代号「Spud」的顶级模型，可能会在4月14日正式发布。

GPT-6的预训练其实早在3月17日就已经完成，目前后训练与红队测试也都已经结束，模型已处于「随时上线」的状态。

在性能基准测试里，GPT-6展现出了极强的压制力——

在编程、推理以及智能体任务（Agentic tasks）方面，相比GPT-5.4性能提升超过了40%。

在参数规格上，GPT-6支持最高200万Token的上下文窗口，达到GPT-5.4的两倍。

让人意外的是，它的价格却相当友好，每百万Token仅需2.5/12美元。

为了这款「终极武器」，奥特曼甚至传出采用了极端做法：直接关闭Sora，并把全部GPU算力重新集中到GPT-6上。

更激进的信号还来自组织结构变化：产品部门已经正式改名为「AGI部署部」。

就在几天前，OpenAI总裁Greg Brockman表示，目前AGI的实现程度已经达到70%-80%，而内部团队相信GPT-6将补上剩余的大部分空白。

不过在管理层面，安全团队已被划归首席营收官（CRO）管理，奥特曼本人也退出了安全监督事务，转而把主要精力投入到数据中心建设中。

自去年年底以来，OpenAI内部始终维持在「红色警报」状态，而GPT-6正是他们准备推出的最终答案。

到那时，ChatGPT、Codex以及Atlas浏览器，或将整合为一款全新的桌面级「超级应用」。

← 上一篇：每日AI速览：亚马逊首度公开AI营收，Q1年化收入超过150亿美元下一篇：社区AI心理机器人七大能力解读：星云星空如何纾解基层服务难题 →