人工智能伦理治理分论坛在京召开:学者共议AI向善之道
6月13日,中国人民大学人工智能治理研究院成立一周年庆典暨第八期学术研讨会在京举办。本次活动由中国人民大学人工智能治理研究院承办,交叉科学研究院、新时代智慧治理学科交叉中心、哲学院、法学院、信息资源管理学院、高瓴人工智能学院、书院建设与管理中心共同协办。上午举行主论坛,下午设四个平行分论坛。
分论坛二以人工智能伦理治理为核心议题,汇集了中国人民大学、清华大学、北京师范大学、中国信息通信研究院等机构的专家学者,涵盖科学技术哲学、认知神经科学、伦理学、人工智能工程、科技政策等多个学科方向,围绕人工智能伦理治理的基础理论、价值对齐、审查机制与实践路径等核心议题展开深入探讨。
第一单元由中国人民大学公共管理学院副教授、人工智能治理研究院研究员仲浩天主持。
中国人民大学哲学院吴玉章讲席教授、人工智能治理研究院研究员刘永谋在题为《人工智能赋能社会科学研究(AI4SS)的三重有限性》的报告中指出,“AI for Social Science”在数据处理、模拟实验、内容生成等方面确实提高了效率、推动了跨学科交流,但尚未实现对社科研究范式的根本性变革,更不能“统一”社会科学研究领域。他同时指出,AI在继承传统社科研究原有问题的同时,也在数据依赖性、黑箱推断与模拟效度等方面产生了新的挑战。他主张以“有限主义”理念定位“AI4SS”,将其视为辅助工具而非替代方案,作为参考而非标准。需明确AI与人类的能力边界,推动“AI赋能社科”与“社科赋能AI”的双向融合,警惕“AI迷信”对学术自主性的侵蚀。
北京师范大学心理学部教授、IDG/麦戈文脑科学研究院PI刘超在题为《以人为本,智能向善——人类利他合作研究及其在AI价值观对齐中的潜在应用》的报告中强调,利他与合作不仅是人类社会存续的道德基础,也是AI“价值观对齐”的重要参照之一。他向参会者介绍了团队运用“沉浸式虚拟现实(VR)+脑成像+计算建模”等多种方法设计的心理学实验,该实验能够直接观测利他与合作行为背后的心理、脑与计算机制,从而在经验层面回答“向善何以可能、如何稳定涌现”的问题。刘超认为,可以将人类道德认知的经验证据与计算模型“转化”到AI对齐研究中,为道德能力评估、对齐约束设计及安全阈值设定提供更具可检验性的理论支撑,使“智能向善”不仅停留在口号层面,而是进一步落实到可测量、可验证的机制层面。
清华大学长聘教授李义天以《人工智能时代也许更需要自我治理?》为题进行分享。他从普通人的视角提出问题:大多数人既不了解AI底层原理,也不在一线开发或产业政策制定岗位,期望每个人对“总体技术”作出正确的治理判断是不现实的。因此,对个体伦理生活而言,与其陷入对宏大技术治理原则的空泛争论,不如先将问题拉回自身:在技术势不可挡的条件下,如何借助既有伦理智慧进行自我治理?他指出,这种“自我治理”并非退守,而是将哲学伦理学的历史传统(节制、明智、责任、知行合一)转化为AI时代的日常伦理能力,它更为切实可行,也构成了全社会AI治理体系中不可或缺的基层环节。普通人参与治理的方式,或许恰恰从这里开始。
第二单元由中国人民大学信息学院副教授、人工智能治理研究院研究员孙彩虹主持。
中国信息通信研究院高级经济师付娜以《人工智能科技伦理审查的实践与展望》为题进行分享。她将伦理审查视为制度基础设施,认为它既是防范技术风险的“刹车”,也是引导技术向善的“方向盘”。她梳理了当前国内AI伦理审查的政策框架(国家-行业-地方多层联动)、运行机制与实施现状;同时也指出这一框架存在的不足,如审查标准不统一、跨机构协同成本高、动态敏捷性不足、对快速迭代模型的事中事后跟踪薄弱等。针对这些问题,她认为面对产业高速迭代的趋势,伦理审查需要走向敏捷治理,例如建立分层分类审查机制、强化全生命周期追踪、打通技术测评与伦理评估的接口,让“向善”真正嵌入研发流程而非仅仅停留在纸面合规层面。
清华大学教育学院副教授、工程教育研究所所长唐潇风以《我们需要为人工智能的幸福负责吗?基于亚里士多德〈尼各马可伦理学〉的初步分析》为题进行分享。他提醒听众,当前关于“AI伦理主体性”的主流争论主要集中在两大方向:能力之辩(AI能否作出负责任的伦理决策)和权利之辩(AI是否应享有某种主体性地位)。在权利进路中,一些讨论已开始涉及AI是否可能有“幸福”?如果可能,开发者是否负有某种“对其幸福的责任”?他借助亚里士多德的幸福观(幸福作为合乎德性的活动,而非单纯快感或效用),审视AI“幸福”概念的可及性与概念误用风险,并指出:这类看似边缘的思想实验,正在撬动现代伦理框架中关于主体、责任与善的根本预设——好的治理不仅要回答“AI能做什么”,也要不断澄清“我们把什么算作善”。
中国人民大学高瓴人工智能学院副教授、人工智能治理研究院研究员张骁以《可控AI初探:基于模型干预的伦理规则注入》为题进行分享。他从机器学习工程视角将“伦理”问题转化为一个可被技术处理的目标:如何在不进行重新训练的前提下,让已部署的大模型实时接入可更新的伦理约束与安全规则。报告讨论了参数生成、模型融合等干预路径,并结合电商场景(合规话术与禁忌边界)、军事问答(红线拒答与可追溯性)等案例,展示“可控AI”在提升安全性、可解释性与业务实用性上的潜力。他的研究关键落点在于,伦理治理不能只靠外部审核报告,也需要内嵌到模型行为与推理链中的可控机制,让“对齐”成为可以在生产环境中持续运营的工程能力,而不只是一次性的上线检查。
在讨论环节,听众与嘉宾围绕“有限主义”下AI辅助社科研究的评价标准、人类利他合作的脑机制如何转化为AI对齐的可量化指标、伦理审查敏捷治理中企业合规成本与监管效能的平衡、“德性”概念能否直接应用于AI主体身份考量等议题展开了热烈的交流。