AI 伪图横行,我开启真相核查模式
最近我做了一件前所未有、甚至从未设想过的举动。
好友发来一张截图,源自某科技企业发布会的现场画面。
我凝视许久,不禁问道:"这究竟是真实现场,还是 AI 生成的作品?"
朋友回应:"你在想什么?这明显是真实的。"
我答道:"如今我已无法确定了。"
这话听起来有些荒诞,但我确实心存疑虑。
究竟发生了什么
AI 图像生成技术在 2026 年春迈入了全新阶段。
GPT-Image-2 能依据单张参考图,生成更高分辨率、细节更丰富的新图像,并支持多轮对话式修改。
输入一张产品照,它能产出不同视角、不同配色的变体。
输入一张会场照,它能生成"同一场地"但灯光各异、人数不同的版本。你甚至可以说"将背景换为夜景,观众减半",它即刻呈现截然不同的画面。
Gemini 2.0 Flash 的多模态版本能解读图片中的文字、图表,甚至识别拍摄风格。
上传一张活动现场图,它能判断光源方向与背景透视是否合乎物理规律,分析人物表情是否过于雷同,还能识别背景中是否存在不合理细节。
Llama 4 Vision 的多模态能力在四月实现了实质性突破。
Meta 将视觉理解能力集成至开源模型,意味着任何人无需付费或申请 API,即可自建图片分析工具并本地运行。
这三项进展叠加,带来的后果是:即便毫无设计背景的人,仅需几分钟描述需求,便能生成一张看似全然真实的"现场照片"。
生成的图像已从模糊的示意图或占位图,进化至媲美专业摄影师拍摄的现场水准。
这是 AI 绘图质量飞跃后的一个具体例证。
朋友圈、科技博主乃至正规媒体,纷纷开始出现 AI 生成的配图。
部分属有意为之——作者认为这样更具"氛围感",或现场未能捕捉到理想画面;部分则为无意——作者自身亦不知图为 AI 生成,读者更难以分辨。
当生成速度超越拍照速度,"现场照片"这一概念便已不复存在。
我意识到这一问题,始于上月。
为何这不止是技术议题
人们探讨 AI 绘图时,焦点常集中于画质。
这张图有多逼真?该功能有何惊艳表现?如何编写提示词以获得更佳效果?
这些讨论并无错误。但它们忽略了一件更本质的事:
我们对图像的信任体系正面临系统性崩塌。
单张假图或许危害有限,但当"假图"变得难以辨识时,所有"真图"的证明力亦同步衰减。
这类似网络谣言的传播——谣言泛滥后,所有信息的可信度皆被拉低。你无法因"多数新闻属实"而放松对每条信息的警惕,因你无暇逐一甄别。
在图像领域,此事正在上演。
欲证明一张图为真,所需成本日益高昂。你需提供原始 RAW 文件,需佐证拍摄时间与地点,需说明为何未经后期处理。
反之,对方仅需声称"此图为 AI 生成",即可让一张真图的公信力大打折扣。
这一规则逆转,鲜有人认真探讨。
我观察到一种微妙现象:我周遭的内容创作者,对"假图"普遍持两种态度。
一种是"无所谓",视 AI 绘图为工具,用之即可,无需特别说明。
另一种是"过度警惕",对所有图片保持怀疑,最终索性不再发布任何内容。
这两种态度皆有弊端,但背后的焦虑确凿无疑。
更隐蔽的是,这种不确定性将缓慢而系统地改变我们对待所有图片的方式。
你开始对每张"现场照片"都怀有一丝疑虑。
这种怀疑虽属理性,却消耗注意力——而注意力乃有限资源。
当我们在每张图上多花两秒辨别真伪,累积起来又是何等成本?
此事我们皆在付出代价,只是无人计算过。
我踩过的坑
分享几段亲身经历。
某次,我看到一位科技博主发布了一张"某 AI 公司发布会"的现场图。
图中会场完备,灯光、舞台、观众一应俱全。舞台中央设大屏幕,显示公司 Logo。
我本欲转发——图确实精美,构图考究,色调专业,属那种"引人点击"的照片。
但我注意到讲台上的 Logo 略显怪异——那是某公司标志,但位置与形状同我记忆略有出入。
我用 Gemini Flash 2.0 上传该图进行分析。
结果显示:"图中元素与公开可查的该公司发布会现场照片在背景结构上存在差异。"
我未转发。
事后与朋友谈及此事,他说我"过于敏感"。
或许吧。但我不想成为传播假图之人,尤其是以"现场照片"之名。
另一次,是朋友圈的一张截图。
某知名投资人在一场活动上"发言",配有多张现场照片。转发者众多,其中不乏我平日信任的信息来源