奥特曼合影竟是AI做的,OpenAI深夜放出图像新王牌
谁都没料到,那张刷爆网络的奥特曼合照,居然是由AI生成的!
就在今天,有大V晒出了一组让人震撼的图片,而这些作品全部来自OpenAI新一代多模态模型GPT-Image-2!
据称,GPT-Image-2的内部代号为GPT-5o/Spud,已在竞技场中悄然亮相。
在完成迭代后,它呈现出了近乎惊人的文本渲染实力,整体表现足以压过Nano Banana Pro。
不管是LOGO创作、YouTube页面截图,还是对版式要求极高的图文排版,GPT-Image-2都能做到近似「像素级」复现。
从已曝光的样张来看,它生成的文字在清晰度和逻辑性上,几乎与真实拍摄无异。
特别是在人物图像生成方面,它已经明显跨过了「恐怖谷」阶段。
眼下,GPT-Image-2几乎刷遍全网,不少人都感叹它「太离谱了」。
看起来,OpenAI这张多模态底牌终于还是藏不住了!
继Nano Banana Pro之后,沉寂许久的「AI生图圈」再次迎来巨震。
去年12月,GPT-Image-1.5强势登场,不但能实现指哪改哪,还是个十足的「细节控」。
仅隔三个多月,GPT-Image-2便迎来了一次近乎「史诗级」的升级。
目前,这一系列模型曾以匿名方式低调出现在Chatbot Arena,随后又很快被下线——
Maskingtape-alpha
Gaffertape-alpha
packingtape-alpha
与前一代相比,GPT-Image-2的提升主要集中在两项极具颠覆性的核心能力上:
其一,它具备极为庞杂的「世界知识」,因此生成出的图像能够更准确地符合现实逻辑和物理常识;
其二,它拥有非常突出的文本渲染能力,基本补齐了传统AI生图在文字拼写与排版上的长期短板。
外界普遍猜测,这正是建立在全新预训练底座上的GPT-5o,其展现出的跨越式提升,绝非4o那种小幅更新可以相提并论。
如今,大量网友正围绕GPT-Image-2展开一场全方位的实测狂潮。
毫不夸张地说,GPT-Image-2在图像生成上的水准,已经对谷歌Nano Banana Pro形成了明显的「降维打击」。
这种极强的空间理解能力与真实质感,让AI生成画面不再带有明显的「塑料感」。
就拿这组宜家外景对比图来说,它在光影细节和透视关系上的表现,几乎到了足以乱真的程度。
曾经,AI生图里的文字处理一直被视作公认的「翻车重灾区」。
很多人想必都还记得,被乱码、多指畸形以及错误世界地图支配的那种尴尬。但如今,这些问题似乎都成了过去式。
现在的GPT-Image-2,已经能够写出相当漂亮的文字。
比如这张YouTube网页截图,整体细节严密贴合,那种像素级的真实感足以让人怀疑是不是截图本身。
再看看这张解剖图,繁复的专业术语标注几乎没有差错,专业度直接拉满。
最让人头皮发麻的,是大V Tz的实际测试:它竟然能写出颇有韵味的中文草书古诗。
这种对复杂汉字结构的掌控能力,强到让人不寒而栗。
设计师的「重武器」已经出现,GPT-Image-2甚至让PS显得像是纯手工时代的工具。
真正让设计圈感到压力陡增的是,GPT-Image-2已经显露出全链路式的设计输出能力。
它不再只是生成一张好看的图片,而是已经能够直接交付接近成品的结果。
无论是复杂精细的Web前端UI,还是逻辑繁复的OS系统界面,它都可以做到近乎像素级的「一步生成」。
这种从创意到原型的极短路径,正在重新定义设计行业的门槛。
甚至连苹果发布会里的OS总览图,它都能复刻得有模有样。
在另一轮测试中,还有人发现GPT-Image-2把「黄色滤镜」问题也解决了。
过去在生成特定构图、应对复杂光影时,AI常常会出现不自然的偏色或者过度磨皮般的平滑感。
但现在,GPT-Image-2已经表现出相当夸张的还原能力。
同时,GPT-Image-2还可以一键生成各类游戏截图。
如果只论人物生成的真实程度,GPT-Image-2已经把标准抬到了新的高度。
看看这张全网刷屏的「奥特曼合照」:皱纹、胡茬、发丝,甚至眼神中的光线细节都被精准还原,几乎看不出任何「AI痕迹」,完全就是现实人物的质感。
此外,对于喜欢二次元风格的用户来说,也算是迎来了好消息。
除了GPT-Image-2之外,OpenAI内部近来的「泄露」也几乎止不住——
这不,关于GPT-6的重磅传闻也已经传得到处都是。
有网友拿到的内部消息显示,这款代号「Spud」的顶级模型,可能会在4月14日正式发布。
GPT-6的预训练其实早在3月17日就已经完成,目前后训练与红队测试也都已经结束,模型已处于「随时上线」的状态。
在性能基准测试里,GPT-6展现出了极强的压制力——
在编程、推理以及智能体任务(Agentic tasks)方面,相比GPT-5.4性能提升超过了40%。
在参数规格上,GPT-6支持最高200万Token的上下文窗口,达到GPT-5.4的两倍。
让人意外的是,它的价格却相当友好,每百万Token仅需2.5/12美元。
为了这款「终极武器」,奥特曼甚至传出采用了极端做法:直接关闭Sora,并把全部GPU算力重新集中到GPT-6上。
更激进的信号还来自组织结构变化:产品部门已经正式改名为「AGI部署部」。
就在几天前,OpenAI总裁Greg Brockman表示,目前AGI的实现程度已经达到70%-80%,而内部团队相信GPT-6将补上剩余的大部分空白。
不过在管理层面,安全团队已被划归首席营收官(CRO)管理,奥特曼本人也退出了安全监督事务,转而把主要精力投入到数据中心建设中。
自去年年底以来,OpenAI内部始终维持在「红色警报」状态,而GPT-6正是他们准备推出的最终答案。
到那时,ChatGPT、Codex以及Atlas浏览器,或将整合为一款全新的桌面级「超级应用」。