风险缓解_标签-酷阅新闻

可信AI智能体综述：安全、鲁棒性、隐私与系统保障

大语言模型正从"被动应答系统"向"具备规划能力、可调用外部工具、拥有记忆体系、支持长期交互的智能体架构"演进。这一技术跃迁在提升自动化水平的同时，也引入了更为棘手的安全隐患：一次恶意的提示注入攻击，其后果可能不再局限于生成错误文本，而会触发危险的工具调用、导致敏感数据外泄，甚至在高风险应用场景中酿成真实的物理后果。本综述《Towards trustworthy agentic AI》围绕可信AI智能体展开论述，着重深耕两个最核心的维度：安全性与鲁棒性，以及隐私保护与系统防护。论文并未将可信性停留在抽象的理

2026-05-28 14:07:48 | 13 阅读