标签

可信AI智能体综述:安全、鲁棒性、隐私与系统保障

大语言模型正从"被动应答系统"向"具备规划能力、可调用外部工具、拥有记忆体系、支持长期交互的智能体架构"演进。这一技术跃迁在提升自动化水平的同时,也引入了更为棘手的安全隐患:一次恶意的提示注入攻击,其后果可能不再局限于生成错误文本,而会触发危险的工具调用、导致敏感数据外泄,甚至在高风险应用场景中酿成真实的物理后果。本综述《Towards trustworthy agentic AI》围绕可信AI智能体展开论述,着重深耕两个最核心的维度:安全性与鲁棒性,以及隐私保护与系统防护。论文并未将可信性停留在抽象的理

2026-05-28 14:07:48  |  5 阅读