标签

AI合成数据:隐私保护还是新型泄露?

研发团队为赶进度,将生产库数据导出,输入本地开源大模型,让其"脱敏"制造一批新测试数据。几分钟后,数千条看似与真实用户毫无关联的新数据出炉——众人如释重负:终于无需苦等数据安全团队审批生产数据导出申请了。但这口气,松得是否合理?若有人追问"这批数据确信不会暴露任何真实用户信息吗",恐怕鲜有人能给出令人信服的解答。测试本就依赖贴近生产环境的数据特征——边界值、异常组合、字段间业务关联,这些才是发现问题的关键,但直接使用生产数据意味着身份证、手机、地址等隐私将在测试环境中原形毕

2026-06-28 02:43:20  |  3 阅读