《智能助手类智能体安全分级规范与建设指南》正式问世

发布时间：2026-06-12 09:41阅读：25

新华网北京 6 月 11 日电（曹素妨向思敏）人工智能正快速从“对话互动”迈向“任务执行”。伴随智能助手类智能体在办公、政务、金融、医疗等场景的深度融合，提示注入、数据外泄、权限被劫、多智能体协作失序等新兴安全隐患愈发显著。如何为智能体“系好安全带”，已成为人工智能产业发展的核心议题。

6 月 10 日，新华网携手中国信息通信研究院等主编及参编单位，正式推出《智能助手类智能体安全分级规范与建设指南》（下称“指南”），致力于为技术提供方、服务提供方及行业用户打造“可控、可信、可追溯”的安全能力架构。

五级安全架构：为智能体界定“安全层级”

指南搭建了从 L1 至 L5 的阶梯式智能体安全分级框架，层次分明、梯度匹配各类应用情境。L1 属基础级，坚守行业基本合规红线，拥有基础防护技能；L2 属进阶级，增强安全管控力度，具备基础防护与审计功能，可抵挡常规安全风险；L3 属自主级，拥有全生命周期防护体系，能应对中高级安全威胁；L4 属协同级，强化多智能体及跨设备协作场景的安全性能，具备跨系统、跨组织的安全协同保障力；L5 属自治级，代表 AI 智能助手安全能力的最高水准，实现安全能力深度应用，拥有纵深防御与可追溯审计能力，可抵御高级持续性威胁。

“不同场景下的智能助手，安全诉求差异巨大。”参与编制的专家指出，“这套分级体系宛如智能体的‘能力资质标尺’，令企业、政府机构及终端用户能依据场景风险等级挑选适配的智能体产品，有效规避标准‘一刀切’、高风险智能体违规落地等难题。”

全链路安全闭环：从输入到协作，每步皆有“护栏”

有别于以往行业标准多集中于模型输出安全的单维度管控，指南立足于智能体全生命周期运行逻辑，围绕“输入→感知→决策→记忆→工具→执行→协作”的运行闭环，为每个运行环节细化明确刚性安全要求。在输入环节，要求防御提示注入与多模态对抗样本；在记忆环节，强调会话隔离、加密存储与防篡改；在工具调用环节，建立工具网关与最小权限边界；在执行环节，落实沙箱隔离与高危操作人工复核；在协作环节，实现多智能体身份认证与群体行为监控。

这意味着，智能助手不再进行“黑箱”操作，而是从数据入口到行动出口，每一步皆可控、可溯、可审计。

重点场景强化：政务、金融、医疗获配“专属安全锁”

指南特别针对高风险领域设定了场景化增强要求。在政务场景，强调“数据不出域”、接入统一身份认证、意识形态安全审核与人工复核机制；在金融服务场景，明确资金类操作强制人工复核、交易操作全链路追溯；在医疗健康场景，规定诊疗建议不得替代执业医师、患者隐私数据严格隔离。

“这并非一份泛化的技术建议，而是一本可落地执行的‘操作手册’。”评审专家指出，“尤其在关乎公共利益、民生保障、群众生命财产安全的关键领域，指南为智能助手的市场准入、日常运行和合规监管全流程，提供了可落地、可核验、可督导的清晰标尺。”

内容安全：为智能体植入“可信知识基因”

值得注意的是，指南在内容安全与价值观对齐层面，特别突出了权威知识底座的重要性。从源头遏制语料污染、知识偏差与内容幻觉，是确保智能体回答有据可查、有源可溯、合规可靠的前提。

新华社拥有全域权威新闻报道的纯净语料与可信信源，汇聚了经严格审核的事实数据、政策文本、主流价值观语料与多领域专业知识，能提供可追溯、可核验、可对齐的“可信知识底座”。指南编制团队指出，将具备可信知识底座的权威智能体相关能力嵌入智能助手的记忆与知识库模块，能有效落实内容安全防控、实现价值观对齐。未来，更多机构可依托此类权威知识底座，快速构建符合安全等级要求的行业智能体。

从规范到能力：安全，正从“防火墙”转为“竞争力”

指南不仅提出技术要求，还同步给出了分级评估方法，涵盖文档审查、配置核查、渗透测试、业务安全测试等多种手段，确保安全能力可量化、可验证、可比较。指南明确指出，安全不再是智能助手的“成本项”，而是构建用户信任、形成差异化竞争力的核心资产。

新华网后续将联合相关机构，推动指南的行业落地与评价体系建设，并持续依托“新华语典”等权威基础设施，为智能体安全治理提供从能力到标准、从评价到优化的完整链条。从“可用”到“可信”，从“对话”到“行动”，指南旨在为人工智能产业健康有序发展筑牢安全根基。

← 上一篇：斯坦福推AI新课，硅谷大咖亲授新范式下一篇：国内AI芯片市场格局与产业趋势深度解析 →