AI安全防护指南
对抗性攻击:数据投毒、逃逸攻击
模型窃取/提取:知识产权损失
数据泄露:推理攻击
偏见利用:不公平结果
NIST AI RMF:NIST AI 风险管理框架
ISO/IEC 42001:人工智能管理体系标准
OWASP AI Security Top 10
GDPR/CCPA/AI Art:隐私法规
一个基础原则:
伦理与公平:减少偏见、提升透明度。
可解释性与可理解性:模型理解。
人机协作 (HITL):监督、问责。
隐私与安全:默认安全设计。
目标:制定人工智能政策、明确AI治理框架及责任、确定风险容忍度。
核心控制措施:建立治理委员会(或纳入现有委员会责任)、建立人工智能道德准则、建立合规审计流程及计划。
输出:批准的政策,人工智能章程,人工智能治理角色及职责 (R&R)。
目标:绘制资产图、了解数据