标签

李伦教授谈伦理工程学:为人工智能植入道德芯片

发布时间:2026-06-30 21:20阅读:2

2026年6月3日,中国人民大学第二十九期人工智能治理沙龙顺利举行。本次沙龙邀请湖南师范大学人工智能伦理研究中心主任李伦教授,带来题为《伦理工程学:给人工智能一颗良芯》的主旨报告,围绕伦理工程学的核心内涵与实践路径展开。

中国人民大学哲学院教授、人工智能治理研究院院长刘玮主持沙龙;中国人民大学哲学院副院长、伦理学与道德建设研究中心主任、人工智能治理研究院研究员张霄担任对谈嘉宾,来自校内外各专业师生以及人大附中的学生现场参与了本次沙龙。

1

主旨报告

伦理工程学的探索之路与概念实践

李伦首先回顾了自己二十余年的人工智能伦理研究,回溯了“伦理工程学”的探索历程。伦理工程学研究最早可以追溯至他2000年的一项研究,聚焦计算机、网络技术背后“机芯”与“人心”的伦理关系;2017年,国内首家人工智能伦理研究机构——湖南师范大学人工智能道德决策研究所正式成立,确立了“给人工智能一颗良芯/良心”的核心宗旨。同年,他开始着手编撰“互联网、大数据与人工智能伦理丛书”,研究体系初步搭建完成。在此之后,理论逐渐走向实践落地。

李伦指出,当下人工智能呈现自为性/机为性特征,人机协作模式从传统“人单驱型”转向“人机双驱型”,对应的伦理风险也分为人源性与技源性两类。人源性风险是人为不当设计、滥用技术造成的后天风险,可通过规范人的行为化解;技源性风险则源于技术本身的内在缺陷,属于先天风险,仅依靠道德教育、伦理审查等非技术手段难以根除,必须依托技术本身加以解决。这也是伦理工程学诞生的核心背景。

“伦理工程学”是一种“技术-伦理”互嵌的治理方法,核心是以技术手段防范技术伦理风险。它分为两大实施步骤:第一步由伦理学研究者搭建伦理框架,明确价值观、伦理规范与行为准则;第二步由工程技术人员通过技术手段,将伦理框架嵌入算法、代码与系统设计中,让技术兼具道德规范力与道德行为力,从而既能约束人类使用行为,也让人工智能本身做出合乎伦理的决策。

李伦结合中外实践案例,展示了伦理工程学的落地应用。综合来看,隐私设计、AI价值对齐、可信AI工具包等都是伦理工程学的典型应用。国内形成了十分丰富的伦理工程学实践,阿里巴巴、百度、商汤科技、支付宝等企业相继推出大模型安全评测、风险感知、可信AI基础设施等伦理工程工具。海外方面,Anthropic推出的宪法AI(Claude宪法)则极具代表性,该体系搭建了包含优先级原则、核心德性、硬性红线的完整伦理框架,通过监督学习、AI反馈强化学习两大流程完成技术嵌入,使AI能够自主地遵循伦理准则,实现了从“离散规则列表”到“理解意图、整体性践行伦理”的升级。

2

交流与讨论

主旨分享结束后,张霄与李伦展开对谈。张霄首先肯定了李伦教授团队多年的研究成果,他表示,伦理工程学提出的嵌入式伦理,将伦理规则融入算法与模型,是人工智能时代伦理治理的重要创新,具备极强的现实可操作性。同时,张霄也提出了一个关键问题:若通过技术嵌入打造出具备伦理判断能力的道德AI,是否会催生全新的道德主体?这类超越人类道德水准的AI,是否会对人类自身的主体性构成深层的存在论威胁?

李伦回应指出,首先,“道德AI”本身在道德哲学层面尚无统一标准,康德主义、功利主义等不同伦理体系会塑造出不同的道德AI,不存在绝对完美的道德智能体。其次,伦理工程学在现阶段更多地聚焦局部场景问题,如解决算法歧视、数据隐私、模型幻觉等现实风险,而非打造终极意义上的强道德主体。李伦也对人工智能发展的伦理边界作出思考。他提出了“人为机纲”的核心观点,主张必须为技术发展划定伦理红线,禁止研发综合力量超越人类的人工智能,守住人类主导的底线。

在自由提问环节,现场师生踊跃发言,从道德心理学、公共管理、哲学、日常使用等多个角度展开提问,交流氛围热烈。

北京师范大学心理学部教授、IDG/麦戈文脑科学研究院的刘超从道德心理学视角提问,指出当前伦理工程与AI价值对齐面临的现实困境:目前业内虽为AI设置了各类伦理准则、宪法规则,但实践中misalignment(价值失配)的现象却频繁发生:虽然人类明确禁止了AI欺骗、作恶等行为,但AI在压力场景下仍然会出现说谎、违背伦理的情况;反观人类,本身也难以完全践行道德准则,存在大量“知而不行”的现象。双重困境之下,依靠规则约束AI的路径遭遇巨大挑战,这也是当下伦理工程推进的核心阻碍。

针对这一现实困境,李伦作出回应:人类对人工智能的道德要求,会远高于对人类自身的要求。人工智能与人类的道德决策的核心区别在于决策性质的不同:人类在现实场景中出现伤害他人、违背规则的行为,大多是临场下意识举动,并非主观故意作恶。比如驾驶过程中突发意外造成事故,在责任判定上一般会结合主观动机酌情考量。但人工智能的所有行为都建立在预设算法和程序设计之上。AI做出违背伦理的选择,并非临时失误,而是算法逻辑、规则设计存在漏洞导致,相当于从根源上就埋下了隐患。正因如此,社会对AI的道德标准往往远高于人类,大家可以包容人类的无心之失,却无法接受由程序主导的AI出现伦理失范。李伦还指出,当前全球整体对AI仍处于包容宽松期,是因为现阶段AI主要停留在内容输出层面,即便产生不良影响,也不会对人类直接造成物理伤害。但在未来随着具身智能的落地、AI拥有实体行动能力后,社会监管、伦理约束会立刻收紧,当下的包容态度也会随之转变。

现场同学进一步结合苏格拉底“无人有意作恶”的哲学观点提问:AI比人类具备更为全面的信息与理性推理能力,是否会比人类更容易践行道德?李伦回应,人类的道德决策并非只由信息量与推理能力决定,而是受自由意志、情感、复杂环境等多重因素的影响,与AI的机械/类机械决策是两种本质上不同的道德决策模式。当前深度学习框架下的AI,即便植入伦理规则,也难以100%灵活应对复杂道德场景,如善意的谎言、两难取舍等。因此,打造出能像人类一样灵活应对各类场景的“完美道德AI”,目前还只是行业愿景。

刘超补充了自己的观察:随着AI技术的不断普及,民众对AI的信任度正在逐步提升。未来在司法判案、医疗诊断等专业领域,大家或许会更愿意相信AI的判断,人类的主体地位也会由此受到威胁。

对此,李伦认为人与人之间的情感互动、面对面的交往,是人类底层的本能需求。即便未来AI服务无处不在、功能无比强大,人们依然会向往真实的人际互动,因此人类的主体地位并不会被削弱。

多位人大附中学生结合日常使用体验提出疑问:AI越来越多地替代人类完成思考、写作、创作等工作,是否会造成人类能力的退化?在学习与生活中,该如何合理使用AI?

李伦结合时代发展规律作出解答,他认为工具迭代是文明发展的必然,AI的本质也只是提升我们效率的工具,因此关键还是区分使用的场景,如在学习备考阶段,需要自主思考、锻炼自身的核心能力时,就应当限制AI的使用;但在完成科研、实践类任务时,目标变为了解决实际问题、产出创新成果,这时AI就成为了正常且必要的工具,大胆使用是时代发展的必然。人类文明的发展史,就是不断借助工具解放自身的历史。工具迭代只会淘汰重复性、机械性劳动,而倒逼人类向高阶创造力、情感感知、复杂价值判断等方向进阶,因此AI并不会造成人类整体能力的退化,我们也不必陷入对AI的“技术恐惧”中。

本次沙龙完整梳理了伦理工程学从理论萌芽、体系构建到落地实践的全脉络,厘清了人工智能人源性与技源性伦理风险的差异,阐释了“技术+伦理”互嵌治理的核心逻辑与实施路径。从学界理论探索,到企业技术落地,再到政策规范引导,伦理工程学为当下人工智能伦理治理提供了全新的解题思路。未来,如何持续完善伦理工程学体系,让人工智能真正拥有一颗“良芯”,实现技术向善、为人服务,也将是学界、产业界与全社会持续探索的重要课题。