微小图像篡改可突破AI防线,有害响应率近乎翻倍
在你看来,它可能像是一张熊猫的图片,但对你公司的 AI 代理来说,它就像一把万能钥匙,可以绕过安全措施,并可能导致模型生成有害的、误导性的或违反政策的输出。佛罗里达国际大学奈特基金会计算机与信息科学学院副教授哈迪·阿米尼(Hadi Amini)的最新研究聚焦于这一风险。他与研究生助理穆罕默德·朱埃尔·米亚(Md Jueal Mia)合作,研究篡改后的图像如何“突破”某些人工智能系统的防线,使其超出内置的安全防护范围。阿米尼说:“人工智能模型看待图像的方式与人类不同。它们看到的是数字和像素的模式。通过精心操