AI安全防护与可信验证技术解析
本资料提供23页完整版本下载,详情可点击文章末尾"阅读原文"获取。
「智盾矩阵·大模型安全智库」是FreeBuf知识大陆的核心社群,现已获评FreeBuf钻石星选社群——获得官方高信誉与高品质认证。该社群专注于人工智能及大模型安全方向,致力于构建国际化视野的专业知识整合平台。至今已累计发布4100+篇文档资源,为行业人员提供理论与实践相结合的全方位知识服务。
本公众号已发布的社群资源概览如下:
①政策法规与标准规范
香港生成式人工智能技术及应用指引
网络安全技术 生成式人工智能服务安全基本要求
网络安全技术 生成式人工智能数据标注安全规范
网络安全技术 生成式人工智能预训练和优化训练数据安全规范
网络安全标准实践指南——人工智能生成合成内容标识方法
网络安全标准实践指南——人工智能生成合成内容检测技术指南
关于通用人工智能模型提供者义务范围澄清指南的制定开展针对性咨询
通用人工智能模型提供者指南
政务大模型应用安全规范(征求意见稿)
人工智能通用大模型合规管理体系 指南
人工智能算法安全评估规范(征求意见稿)
工业和信息化领域人工智能安全治理标准体系建设指南(2025版)
生成式人工智能开发和利用个人信息处理指南
移动智能终端端侧大模型安全实施指南
安全应急大模型标准(征求意见稿)
政务大模型应用安全规范
《人工智能安全治理框架》2.0版
智能终端大模型应用评估规范
人工智能生成合成内容标识管理能力要求
智能体信任评估实施指南(征求意见稿)
生成式人工智能模型训练合规技术规范
智能终端大模型应用评估规范
智能体行为安全要求
大模型一体机产品安全基本要求
人工智能计算平台安全框架
人工智能数据处理伦理要求
人工智能通用大模型合规管理体系指南
生成式人工智能服务安全应急响应指南
大模型一体机产品安全基本要求
人工智能训练数据清洗安全指南
人工智能应用安全指引 总则
人工智能应用安全指引 广播电视和网络视听
用户使用人工智能服务安全指南
智能体安全评测规范
智能体任务执行安全要求
生成式AI内容安全与伦理审查规范
人工智能网络安全框架规范
智能体人工智能模型治理框架
网络安全标准化技术研究报告-智能体安全标准化研究
②领域解决方案
大模型时代下的安全挑战及应对
腾讯大模型安全治理实践
360集团应用安全和基础安全建设实践
大模型与智能体安全风险治理与防护
AIGC安全评估解决方案
京东云大模型安全实践
安全大模型发展路径洞察与实践
LLM-WAF:大模型安全防护
③专业技术报告
Agentic AI安全技术应用报告
AI 组织责任:治理、风险管理、合规与文化方面
人工智能安全作为全球公共产品:影响、挑战与研究重点
AI应用于进攻性安全
人工智能法律政策图景研究报告(2025年)
云上人工智能安全发展研究报告(2025)
大模型训练数据安全研究报告
智能体安全实践报告
前沿人工智能风险管理框架
生成式人工智能与著作权:训练、创作及监管
AI风险缓解措施的研究报告
安全优先的大模型研究报告
AI赋能主动防御技术应用指南(2025版)
AI时代数字身份安全技术应用指南
AI时代网络安全产业人才发展报告(2025年)
端侧大模型安全风险与治理研究
人工智能治理案例集(2025)
机密计算保障人工智能系统安全研究报告
算力网络数据安全研究报告
人工智能安全研究报告——技术视角下的安全风险梳理与应对(2025)
金融大模型应用安全研究报告(2025)
AI模型风险管理框架
智能化安全运营中心应用指南
大模型组件漏洞与应用威胁安全研究报告
安全智能体魔方:成熟度模型评价研究报告
金融生成式AI多模态内容鉴伪与安全防御报告(2025)
2025全球可信AI治理与数据安全报告
AI时代Agent原生企业崛起-现状、趋势与风险控制(2025版)
AI安全:构建负责任且可靠的系统
Google Gemini AI安全性与红队报告
AI安全指数报告
人工智能安全与治理现状报告
开源大模型法律风险及防范
2025年度全球人工智能治理报告
智能物联网(AIoT)安全技术与应用研究报告(2025年版)
通信行业人工智能数据治理实践指南
人工智能推动金融数据治理转型升级研究报告
人工智能安全治理研究报告(2025年)
数据治理研究报告-端侧大模型数据治理法律要点研究
人工智能3.0:智能浪潮下的法律、博弈与战略报告
行业数智化AI安全实践研究报告
人工智能用户权益保护关键问题研究报告
人工智能安全指数报告
人工智能治理研究报告(2025年)
OpenClaw运行机制与安全威胁研究
2026年国际人工智能安全报告
2026前沿人工智能风险管理框架报告
最全企业级安全养虾教程
Openclaw安全实战指南
④技术白皮书
终端智能体安全2025
AI风险控制实践白皮书
医疗健康大模型伦理与安全白皮书
人工智能安全治理白皮书
AI基础设施安全白皮书(2025)
AI智能体安全治理白皮书
大模型安全密码应用白皮书
金融人工智能发展与安全白皮书(2025)
阿里云百炼安全白皮书(2025)
智慧城市低空应用人工智能安全白皮书
AI 隐私安全白皮书
大模型安全白皮书
华为算力基础设施安全技术白皮书
AIGC全生命周期业务风控白皮书
AI-R-SOCC AI就绪的安全合成管理中心白皮书
低空智能网联网络与数据安全体系白皮书(2025)
以新质战斗力引领“AI+”时代网络安全
中国Data&AI数据基础设施白皮书
人工智能安全风险测评(2025 年)-白皮书
生成式 AI 安全白皮书
移动终端智能体隐私安全白皮书
AI安全合规白皮书
AI时代数据治理白皮书2025
AI 网络爬虫安全白皮书
AI智能体的实践应用:评估与治理基础框架白皮书
具身智能安全技术白皮书:机器人篇
⑤学术技术论文
在MCP驱动的智能代理系统中识别和缓解第三方安全风险
LLM驱动的AI Agent通信:协议、安全风险与防御对策
⑥实践操作指南
⼤模型及多智能体系统安全⻛险分析和洞察
AI 安全⻛险评估和控制指南
生成式AI红队百次测试经验白皮书
大语言模型Prompt攻击手册
AI迷思录(应用与安全指南)
Agentic AI 红队测试指南
AI安全的红队测试方法指南
AI安全与数据保护中的法律与合规
涉及个人数据的安全AI系统基础
大型语言模型 (LLM) 安全风险、案例与防御策略
LLM越狱攻击与防御框架
生成式人工智能服务备案表&登记表
AI智能体运行安全测试标准
大模型安全威胁框架
大模型安全开发手册
人工智能安全承诺实践披露
人工智能控制矩阵
大模型 私域部署安全落地参考手册
人工智能系统开发测试与评估指南
前沿人工智能模型安全框架示例
红队AI:攻击与防御智能系统
prompt越狱手册
覆盖700余种风险,MIT发布最全AI风险数据库
人工智能系统风险管理指南
AI大模型合规100问
OWASP 智能体应用 Top 10 2026
智能体应用程序安全指南
AI智能体—威胁与缓解措施
生成式人工智能服务合规备案指南(2026年)
OpenClaw极简安全实践指南
OpenClaw网络安全风险分析和防护措施指南
OpenClaw(龙虾)专项安全风险预警以及建议防护方案-奇安信
OpenClaw安全风险分析及防护建议-启明星辰
AI安全新人扫盲
OpenClaw安全部署与实践指南(360护航版)
云上养虾(OpenClaw)安全指南
OpenClaw安全操作指南
大模型驱动安全升级:腾讯代码安全应用实践
百度端侧大模型的安全建设:如何在算力与保障之间找到平衡
京东大模型安全挑战与实践:构建AI时代的安全防线
大模型平台与应用安全防护
LLM内容安全性的挑战与优化从数据到算法
MCP协议标准化研究工作沙龙—— 大模型与智能应用的信息交互主题精彩回顾
DeepSeek R1技术复现与大模型的治理与安全
AI重构全球数字基建:美的多云统一数字化底座与出海的安全合规建设
金融AIGC安全攻防构建大模型时代的数字内容风控体系
教育大模型评测体系构建与场景化测试实践
大模型幻觉检测在垂域任务的应用实践
AI赋能eBay支付风控:从用户行为到交易安全的全面智能化
大模型驱动的账户风险管理
代码大模型的安全问题 - 终端用户与模型供应商的双重视角
论如何控制大模型
大模型驱动的数据清洗与数据合规
百度基于大模型安全运营的质效提升实践
大模型上线备案&算法备案全析
AI Agent应用攻击面漫谈
LLM 间接提示注入 漏洞解析与防御路线
大模型合规安全审计
LLM&Agent安全防护实战:业务落地视角下的风险管控与解决方案
AI安全提示词注入分享
火山引擎AI安全保障实践
AI赋能红队的技术实践与效能突破
组件安全:AI检测与漏洞利用路径预测
智体赋能:基于大模型Agent的自动化渗透测试框架设计与实践
腾讯大模型安全治理实践
大模型驱动的自动化渗透测试边界突破实践
AI大模型在数据安全领域的实践探索
AI算法可信安全:如何从根本上打破AI黑盒
在幻觉与超能中前行:大模型参与安全运营的应用探索
微步安全AI实践
AI智能体安全治理的认识和实践
大语言模型中的事实性幻象
大模型安全治理与评测体系化研究与实践
人工智能时代的个人信息保护:挑战与机遇
AI赋能的DevSecOps自动化安全实践
LLMAgent安全攻防战从架构风险到应用实战剖析
AI生成代码安全边界测绘与选型指南
百度大模型 原生安全构建之路
大模型安全考量:安全的大模型解决方案
DeepSeek赋能安全运维智能化转型的实践之道
AI数据资产体系建设:从数据处理到模型评估的全生命周期闭环
从技术赋能到范式革新:快手安全大模型驱动内容审核智能化重塑
面向AI场景:可观测平台在安全运营体系建设中的实践
APP隐私合规检测-AI隐私文本分析模型
大模型安全风险与对抗实践培训
AI赋能红队的新优势
OWASP大模型安全Top 10分析与实践
智能体应用和大模型安全评测实践
检测与响应:大模型与SOAR驱动的自动化漏扫运营
攻防加速:大模型赋能 VxWorks 漏洞分析与验证效能革新
大小模型协同驱动安全升级-基于大小模型协同的数字内容风控实践
面向未来的DevSecOps:Kodem如何用AI重塑应用安全
隐私不上云,模型放心用:通过结构化语义标签实现隐私防火墙
基于Spec Driven范式,开发安全可控的SRE智能体
NLP类AI系统鲁棒性评测挑战与实践
AI驱动的智能体、车端协议与供应链安全闭环
LLM白盒检测水平越权漏洞实践
AI辅助整车信息安全TARA分析探索
大模型供应链安全的熵增效应:风险挖掘与熵减策略
AI与安全的双向赋能:从对抗到防御
基于大模型Agent构建自动化渗透测试平台的探索
AI落地软件开发的实践与挑战(华为)
攻击者视角下的业务智能体渗透
构筑智能化攻防格局_网络安全实验室的战略与未来蓝图
企业内部的渗透测试自动化探索
机遇和挑战:大模型及其生态的安全性和脆弱性
AI红队攻防实践
大模型应用落地安全风险和防护实践
轻装上阵_Javassist聚焦代码审计关键点实践
安全领域大模型构建范式与实践
安全智能重构:大模型安全应用研究前沿
基于大模型的安全智能中心CIC Pro
SecGPT赋能网络安全-MCP助力下的创新与挑战
大模型供应链安全风险技术拆解与案例复现
从应用落地到安全护航:Agent系统的开发实践与可信防御
揭秘黑灰产AI的潘多拉魔盒
大模型及其智能体安全
产品视角下的安全革新:AI漏洞猎人如何破解代码漏洞挖掘痛点
智算安全可信行业观察
Fuzzing4LLM:撬动大语言模型的安全对齐机制
AI 渗透的蜂群思维-轻量级多Agent协同与实战复盘
AI驱动二进制安全-从静态到动态的探索
Agentic AI时代下的应用安全演进
基于AI的车联网渗透及法规检测
多智能体协同驱动的自主进化渗透测试系统
大模型驱动下的稳定与安全双螺旋——从“事后救火”到“主动免疫”的技术进化
Cruiser:CTF Agent实现探索
AI上车的安全合规分析与实践
AI时代的新型威胁-企业防范AI投毒与AI幻觉指南
360基于大模型赋能的网络安全解决方案
AI 红队智能进化大模型与智能体驱动的自动化渗透测试及安全验证
AI驱动下石油石化行业的安全新挑战与协同应对
分享
收藏
在看
点赞