创锐丰科技助力AI智能体标准制定,推动行业规范化进程
AI智能体正加速从实验室走向各行各业,然而"能力如何界定、怎样评估"始终是制约产业健康发展的关键瓶颈。近期,中国移动通信联合会正式发布团体标准T/ZGCMCA 011-2025《人工智能 智能体能力要求》,并将于2026年4月16日开始执行。作为核心起草单位之一的天津创锐丰科技,全程深度参与标准编写,为AI智能体能力评价体系的搭建提供了关键的工业场景实战支撑。
一、标准发布:填补国内AI智能体能力评价领域的空白
📋 标准基本信息
标准编号:T/ZGCMCA 011-2025 标准名称:人工智能 智能体能力要求(Artificial intelligence—Agent capability requirements) 发布时间:2026年4月16日 实施时间:2026年4月16日 发布机构:中国移动通信联合会
如今,AI智能体在大模型时代已成为主要应用形态,广泛运用于工业制造、金融、医疗、城市管理等板块。但行业长期存在三大痛点:能力界定不清、评估维度不统一、安全规范不足,极大限制了产业发展。此次发布的标准由中国移动通信联合会主导,联合全国50多家顶尖企业、高校及科研机构共同制定,首次系统性地构建了AI智能体能力评价体系,填补了国内该领域的标准空白。
二、核心框架:五大评价维度系统界定智能体能力
标准界定了AI智能体的5大核心评价维度,覆盖从感知输入至工具执行的全流程能力,为智能体的研发、测试、评估及运用提供权威参考。
🔍 维度一:感知理解能力
视觉识别(目标检测、图像分类、场景分割、异常检测);语境理解(上下文依赖、长上下文、多对象一致性);多模态融合(跨模态知识迁移、模态缺失适应);规划执行(自主感知与规划执行)。
🧠 维度二:认知推理能力
知识推演(常识推理、多步骤推理、知识图谱推理、反事实推理、多模态协同推理);逻辑分析(因果关系分析、逻辑一致性检验、抽象概念理解、类比推理)。
✍️ 维度三:内容生成能力
指令遵循(复杂指令分解、动态指令响应、跨模态指令执行、幻觉缓解);多模输出(视觉与文本交错生成、静态/动态视频描述性文本生成)。
📚 维度四:知识能力
行业知识能力(医疗健康、金融、法律等垂直领域术语理解、规范遵循、专业知识准确调用、跨领域知识融合);通用知识能力(自然科学、社会科学、语言与语义等领域知识理解与准确生成)。
🔧 维度五:工具使用能力(创锐丰重点贡献方向)
工具调用明确性(基于MCP等协议选择正确工具);工具调用安全性(权限管理、高敏感操作确认、错误捕获、全链路可观测性与审计留痕);工具调用效率(单次推理确定参数、支持并行调用、参数校验、失败重试与自我纠正);MCP等标准化协议完整适配能力。
三、创锐丰科技:以工业实战深度支撑标准制定
天津创锐丰科技有限公司自2020年成立以来,一直深耕企业级IT服务、人工智能、大数据、物联网等核心领域,为汽车、芯片、金属加工、城市运营等行业客户提供数字化、智能化的一体化解决方案。
公司自2022年底起,率先将大语言模型、AIGC技术与工业场景深度融合,研发私有化智能系统与设备管理解决方案,在智能体落地、能力优化、安全管控等方面积累了丰富的一手实战经验。
🏭 创锐丰核心贡献
作为核心起草单位,创锐丰科技为标准编制提供了大量工业场景化案例与技术实践支撑,特别是在工具使用能力、安全要求和评价模式等核心章节,融入了工业智能体实际部署中关于权限管控、工具调用安全、MCP协议适配等方面的宝贵经验,使标准兼具前瞻性与工程落地价值。
四、安全为先:八项安全要求构筑智能体安全防线
标准在第10章专门规定了AI智能体的8项安全要求,覆盖从数据访问到分布式通信的全流程,兼顾技术创新与安全可控,这也是本次标准的一大亮点。
🔒 八项安全要求速览
① 全链路访问权限管理(最小权限原则) ② 对抗性风险防御(对抗样本攻击防御、非法输入拦截) ③ 内容生成安全防护(有害内容识别、避免过度敏感) ④ 自主规划与工具调用系统级风险防护(多层级授权校验、风险隔离) ⑤ 操作追溯与日志安全(全量操作记录、核心文件防篡改) ⑥ 分布式与通信安全(加密通信、权限统一管控) ⑦ 隐私保护与数据安全(差分隐私训练、隐私数据全生命周期管理) ⑧ 可解释与稳健性评估(安全决策可解释、定期量化评估)
五、科学评价:多元模式与三层指标体系
标准设计了4种评价模式和3层评价指标,确保评价过程的全面性、灵活性与可复现性。其中,交互式动态评价为强制评价模式,要求模拟智能体实际应用中的真实交互场景。
⚙️ 四种评价模式
多样性评价(自动化+人工+专家评审,多维度综合考量);灵活性评价(可配置评估框架,支持指标动态调整);可靠性评价(标准化流程,完整评估记录可追溯);交互式动态评价(强制模式,多轮对话、环境实时反馈、连续决策全过程评估)。
📊 三层评价指标
功能表现指标:准确性(识别准确率、多模态融合匹配精度、知识推理正确率);鲁棒性(噪声干扰稳定性、对抗样本防御、泛化能力)。 非功能表现指标:安全性(内容安全过滤、防攻击、隐私保护、合规性);公平性(群体性能一致性、输出无偏性、决策透明度)。 性能表现指标:响应时间(平均响应时间、业务处理延迟、高负载表现);并发度(最大并发处理能力、分布式扩展性能)。
T/ZGCMCA 011-2025《人工智能 智能体能力要求》的正式实施,标志着我国AI智能体产业迈入了"有标可依、有据可评"的规范化发展新阶段。作为核心起草单位,天津创锐丰科技将持续把标准精神融入产品迭代与解决方案设计,推动标准在工业领域的落地应用。
未来,创锐丰科技将以此次标准发布为新起点,持续深耕工业AI智能体技术研发,助力更多传统企业借助标准化、规范化的AI智能体实现数字化转型与智能化升级。