遏制AI数据污染
随着生成式人工智能深入应用至各行业,它已成为公众获取信息、辅助判断与整合知识的核心工具。然而,AI并非无中生有的‘全能系统’,其能力高度依赖数据、模型、算法及使用场景。AI的‘智能’实质是其训练数据与底层算法的映射,这种深度依赖催生了一种名为AI‘投毒’的新型安全威胁。
AI‘投毒’不同于传统网络攻击中常见的系统瘫痪或数据窃取,它是一种针对逻辑与知识根基的隐性攻击。攻击者通过在AI训练数据、模型微调过程或插件接口中注入虚假信息与恶意指令,使模型在保持语言流畅、专业外观的同时,输出误导性结论或偏颇立场。作为一种智能时代的‘隐形污染’,该风险潜伏周期长、操控隐蔽,正随着AI普及,日益威胁社会认知安全与决策可信度。
AI‘投毒’的本质
要理解AI‘投毒’,需先认识人工智能模型如何提升能力。以大语言模型为例,它通常需在海量文本、代码、图像标注、结构化知识和交互记录中进行训练,借助统计规律、语义关联与上下文模式,学习如何理解问题、组织回应并生成内容。模型本身并不天然具备现实知识,它仅通过数据习得语言与信息,在用户提问时生成最符合上下文的回应。