AI伪造泛滥:眼见耳听已非真相
想象这样一个场景:你正在上班,手机突然响了,是正在国外留学的孩子打来的视频电话。屏幕里,孩子神色慌张,说自己遇到了紧急情况,急需一笔钱。你看着那张熟悉的脸,听着那焦急的声音,一切无比真实。你可能不会有丝毫怀疑,立刻准备转账。
但如果我告诉你,视频对面那个“人”,其实完全是由人工智能生成的数字幻影呢?
这并非科幻小说里的情节,而是正在发生的现实危机。当AI能够完美复刻你的容貌和声线,我们曾经坚信的“眼见为实、耳听为真”,正遭遇前所未有的冲击。
深度伪造(Deepfake),由“深度学习”和“伪造”两个词组合而成。它并非简单的修图或剪辑,而是基于深度学习算法,对人物的面部、声音、动作、表情进行高度逼真的模拟与替换,生成肉眼难以分辨的虚假音视频内容。
为了让你理解这个技术,我们可以把AI想象成两个被关在小黑屋里的对手:一个叫造假者,一个叫鉴别者。
造假者的任务是凭空创造出逼真的人脸图像,试图骗过鉴别者。而鉴别者的任务是判断这到底是真实拍摄的照片,还是造假者的手笔。
在训练初期,造假者的水平很烂,画出来的人脸五官错位,鉴别者一眼就能识破并打回重造。造假者只能吸取教训,不断改进算法。
这场猫鼠游戏会进行数百万次甚至上亿次。最终,当造假者生成的图像连最严格的鉴别者都无法区分真伪时,一个训练有素的Deepfake模型就诞生了。
这种“生成对抗网络”的左右互搏机制,让AI得以捕捉到人类面部最微妙的特征数据,从而实现令人咋舌的逼真度。从早期的边缘模糊、表情僵硬,到如今发丝级别的精细,甚至连皮肤的纹理和微表情都惟妙惟肖。
如果说AI换脸已经足够惊悚,那么AI声音克隆技术的发展速度则更加令人不安。
在过去,想要合成一个人的声音需要他在录音棚里录制几十个小时的素材。而现在,技术的门槛已经低到了尘埃里。
最新的语音合成模型只需要短短几秒钟的目标人物录音样本,就能分析出其声线、语调、口音甚至说话习惯。从事AI音频创作的技术人员提醒:只需要5秒,AI就能复制你的声音。
这些样本可能来自你日常通话中的随意应答、社交平台上的语音留言、短视频,甚至是在与陌生号码“闲聊”时不经意间留下的声音片段。声纹,正在成为和身份证、银行卡密码一样核心的隐私。
当高精度的面部替换遇上实时的声音克隆,一个能在视频通话中与你对答如流的“假亲人”或“假老板”就诞生了。
这不是理论推演。以下案例全部真实发生。
湖南的刘奶奶接到一通电话,电话那头传来“孙子”焦急的声音:“奶奶,我不小心撞了人,千万别让爸妈知道,你快救救我!”
刘奶奶慌了神,立即按照对方的指示去银行取了3万元现金,在村口将钱亲手交给了所谓的“所长亲戚”。
事后才发现,那根本不是她的孙子——骗子用AI克隆了孙子的声音。这类骗局中,骗子利用AI换声、换脸冒充亲友实施诈骗,对象多为老年人,套路普遍为“孙子惹祸,急需用钱”。
福建的郭先生是一家科技公司的法人代表。他的好友突然通过微信视频联系他,称自己的朋友在外地竞标,需要430万元保证金,想借用郭先生公司的账户走账。
基于对好友的信任,加上已经视频聊天“核实”了身份,郭先生在10分钟内分两笔把430万元转了过去。
事后,郭先生拨打好友电话才得知被骗——骗子通过AI换脸和拟声技术,佯装好友对其实施了诈骗。
“当时是给我打了视频的,我在视频中也确认了面孔和声音,所以才放松了戒备。”郭先生事后说。
陕西西安某公司财务张女士,和“老板”视频通话时,对方的样貌、声音都十分逼真,要求紧急转账186万元。张女士照做后,在公司群核对才发现,老板根本没发起过视频——这是典型的AI换脸+语音伪造诈骗。
这些并非个案。公安部数据显示,2025年一季度全国AI换脸诈骗案环比增幅已达45%;今年以来全国AI换脸及仿声诈骗案件同比激增45%。
更令人不安的是犯罪门槛之低。调查发现,AI换脸、换声相关服务教程在网上随处可见,打包价格低至1元。境外平台上的黑灰产从业者提供从换声到换脸的“一条龙服务”,标价仅十几元至百元不等。暗网平台甚至公开售卖“一键克隆语音”工具,成本仅需几十元。
技术门槛的断崖式下跌,让深度伪造从专业影视特效迅速扩散到黑灰产乃至恶意使用者手中。
传统修改停留在画面表层,而深度伪造是从数据层面重建人物的面部结构、表情动态、语音韵律、唇形同步,伪造内容连贯、自然、细腻,几乎达到以假乱真的程度。
研究人员曾发现,早期的Deepfake视频里人物眨眼频率不自然——因为训练数据中缺少闭眼的照片。但这很快就被造假者修复了。现在的检测技术已经开始深入到更隐秘的生理层面,比如通过分析视频中皮肤像素的色彩波动来判断是否存在心跳泵血的生命体征信号——连这种级别的检测都出来了,可见伪造技术已经逼真到什么程度。
深度伪造带来的不仅是个人财产的损失,更是整个社会信息生态的崩塌。
当人们无法分辨真实与虚构时,“信息荒漠化”就会发生。今年全国两会期间,“AI魔改”经典、“深度伪造”诈骗等话题频上热搜。国家互联网应急中心监测显示,2024年涉及深度伪造的网络安全事件较上年增长近3倍。
更可怕的是,深度伪造的矛头已经指向公众人物——仅需一张照片、一小段语音,就能生成足以乱真的视频,假冒明星、主持人、企业家等发布不实言论。演员温峥嵘就曾发文控诉,自己的脸被AI“盗用”,“移花接木”到带货主播身上卖货。李连杰、姚明等名人也曾卷入类似的虚假营销。
当任何人都可能成为深度伪造的受害者,当任何视频都可能被质疑为伪造——我们还能相信什么?
好消息是,目前的AI技术在处理复杂物理环境时仍有破绽。掌握以下方法,就能有效防范。
目前的AI换脸本质上是实时渲染。如果对方要求转账,请让他做一个大幅度动作,比如用手在脸前挥一挥,或者快速转头、摸鼻子。
AI在处理面部遮挡和快速动作变化时,往往会出现渲染延迟、边缘扭曲或“面具脱落”。实时伪造的视频在挥手过程中,会造成面部数据干扰,所伪造的人脸会产生一定的抖动、闪现或其他异常情况。
仔细观察对方的眼神和口型。AI生成的视频常存在微小的音画延迟,声音与口型可能不完全同步。同时注意瞳孔反光是否自然,眨眼频率是否正常。
AI虽然能模仿生物特征,但无法读取共同记忆。问一些只有你们两个人知道的“暗号”,是识破伪装的终极手段。
和家人、同事设专属转账暗号,涉及资金往来先对暗号,不对绝不转账。
视频、语音都不能作为唯一依据。凡是接到亲友通过陌生号码、社交平台新号提出借钱、转账等请求,必须通过原有联系方式进行电话回拨或当面核实。骗子惯用紧急、限时、保密逼你快速操作,遇到突发转账要求,先暂停冷静。
不随意在社交平台发高清正脸照、完整语音、日常视频。关闭陌生APP的摄像头、麦克风权限,防止生物信息被盗用。接到陌生电话千万不要先出声——5秒就足以让AI复制你的声音。
面对深度伪造的威胁,技术界并没有坐以待毙。
显式标识:国内已要求AI生成内容添加显式标识,比如在AI生成的图片角落标注“AI生成”。
隐式标识:在文件元数据中添加“隐形身份证”。目前行业正在推广C2PA(内容