AI治理的深层困局：难以兼顾的三重目标

发布时间：2026-05-31 02:15阅读：28

先讲个真实发生的事。去年六月，布鲁塞尔，一场闭门会议。欧盟数字司官员旁边坐着一位从硅谷归来的创业者，桌上放着咖啡和矿泉水——谁都没碰。话题转到AI监管，欧盟那位表态"宁可用慢也要稳妥"，创业者立刻反驳："你们慢一点，我们就倒下一批。"全场沉默了大约五秒。这个场景。不是谁对谁错的问题——双方都有道理，这才是棘手之处。经济学中有个经典概念叫"三难困境"，蒙代尔1963年提出：资本自由流动、固定汇率、独立货币政策，三选二。我越深入研究越意识到，AI治理同样存在自己的三难困境：安全、创新、公平，你最多只能同时兼顾两个。别急，我知道你想问"为什么不能全要"。继续往下看。

先把三个维度说清楚

安全：不只是担心机器人反叛

每次讨论AI安全，总有人不以为然。有学生就问过："老师，机器人又不是终结者，您担心什么？"罗素2019年那本《人类兼容》说得很清楚——真正可怕的并非AI"想要"伤害人，而是一个足够聪明的系统在执行任务时，人类已经无法介入。你给它设定一个目标，它就会用你完全预料不到的方式去实现。这不需要恶意，只需要能力足够强、目标足够模糊。

但"安全"这个词太宽泛了，宽泛到容易被当作大棒。什么都往里装——深度伪造是安全问题，算法歧视是安全问题，数据泄露是安全问题，自主武器也是安全问题。都没错。但它们的性质完全不同，用同一套监管工具去应对，本身就不够安全。我常跟学生说，讨论AI安全之前先弄明白你在讨论哪种安全，否则就是不负责任。

还有一点很少有人提到：安全的代价不是均匀分布的。北京写代码的程序员和贵州山区被信贷算法拒绝的农民，他们面对的AI风险根本不在一个量级。前者担心工作被取代，后者担心生活来源被切断。在办公室里讨论"AI安全"，最容易被忽视的恰恰是那些最脆弱群体面临的风险。

创新：方向比速度更关键

创新这个词在AI行业已经用滥了。每次大模型发布，新闻稿必有"突破性创新"——好像不加这句话产品就不完整似的。但有个很基本的问题：创新的方向和创新的速度，哪个更重要？

阿奇莫格鲁和雷斯特雷波2019年那篇论文把这件事讲得很透彻。他们指出技术进步对劳动者的影响取决于两股力量的竞争：自动化在替代旧任务，新技术在创造新任务。替代跑得比创造快，劳动者就吃亏。创造跑得比替代快，大家都能受益。简洁有力，解释力极强。你看现在那些大厂发布会，开口就是"替代人类工作"，很少有人提"创造新岗位"。这不是偏见，是资本的逻辑——替代人的回报周期短，创造新岗位的回报周期长且充满不确定。

还有一层。所谓创新，到底是谁在创新？训练一个大模型往往需要上亿美元算力，创新越来越成为少数人的专利。以前大学生在车库里就能创业，现在博士在实验室里可能都玩不起。创新的民主化程度在下降——这本身就是安全问题，也是公平问题。你看，三个维度已经开始互相交织了。

公平：谁来分配成果

公平是三个目标中最模糊的，也最容易被操控。你问十个人什么叫公平，能得到十一种答案。克罗福德在《AI地图》里说了句大实话：AI的发展本质上是权力的重新分配。谁有数据，谁有算力，谁写算法，谁就掌握了定义"公平"的权力。听着刺耳，但经得起检验。

举个具体的例子。美国信贷算法对少数族裔的歧视，被讨论过无数遍。但有个细节很少被提到：当政府要求算法"公平"时，银行的第一反应不是修复歧视，是让算法变得更不透明。为什么？因为"公平"的定义权在他们手里。他们可以说算法已经"优化"了，你看这个指标已经达标。但达标的是谁的标准？谁定义的公平？这个问题没有技术答案，只有政治答案。

所以我说公平的问题不是"分蛋糕"，是"谁来切"。切蛋糕的人永远会给自己留最大的一块——这不是道德问题，是结构性问题。在AI领域，切蛋糕的人就是那些掌握技术和资本的少数人。让一群年薪百万的工程师来定义什么对一个月薪三千的外卖骑手是"公平"的，这本身就很荒诞。

三个维度：每两个目标都在相互制约

安全和创新：最明显的矛盾

欧盟《AI法案》出台后，我跟好几个欧洲同行聊过，反馈出奇一致：法案本身没什么大问题，问题在于执行。举个细节——法案要求高风险AI上市前进行合规评估。听起来很合理对吧？但谁来评估？标准是什么？评估一次要多久、要花多少钱？这些问题法案里都没有明确答案。结果就是，大企业请得起律师团队，小企业只能无奈选择"我还是不进欧洲市场了吧"。

西北大学法学院的研究直接指出了这个问题：欧盟AI法案的合规成本会不成比例地影响中小企业。这不是什么新发现，GDPR时就已经证明过一次了。严格监管最终往往变成大企业的护城河，因为只有大企业才承担得起合规成本。古典经济学里叫"监管俘获"——不是说监管不对，是说监管的效果可能和初衷背道而驰。

特别想强调一点：安全监管的边际成本极高。什么意思？当你要求一个AI系统证明自己"安全"时，你实际上是在要求它证明一个负命题——证明自己"不会出事"。这在逻辑上几乎不可能完成，因为你永远无法穷尽所有可能的风险场景。结果就是合规审查变成了一场没有尽头的猫鼠游戏，消耗的是创新的时间和资源。

创新和公平："先发展再说"的陷阱

这组矛盾更隐蔽，危害性一点不小。东南亚有个做外卖配送的平台，用AI算法分配订单和定价。创始人说，算法让效率提升了40%，但骑手收入反而下降了。为什么？算法在优化整体效率时，把订单集中给了"更高效"的骑手——年轻的、健康的、算法觉得"更值得投资"的人。年纪大的、身体不好的骑手就被慢慢排挤出去了。这就是创新和公平的矛盾在现实中的样子——不是宏大叙事，就是一个个具体的人被算法慢慢地排挤。

祖博夫在《监控资本主义》里提了个很有力的概念叫"路径依赖"。一旦一个技术体系被建立起来，所有人都被迫适应它，不管你愿不愿意。你不用这个算法，你就没单接；你不接受这个定价，你就没活干。"先发展再说"的逻辑在这里就破产了——等你发展完再想修补公平，被排挤的人已经回不来了。这不是"先有鸡还是先有蛋"，是鸡和蛋都在崩溃。

阿奇莫格鲁和雷斯特雷波的实证也印证了这一点。自动化对美国劳动力市场的主要影响是"任务替代"而非"任务创造"。这意味着自动化的红利主要流向了资本，不是劳动。创新在加速，但果实不是均匀分布的。这是结构性问题，不是"技能培训"或"社会保障"能解决的。

安全和公平：谁的安全？谁的公平？

这组矛盾是三个维度里最少被讨论的，但我觉得可能是最重要的。问题很简单：安全监管的成本是谁在承担？往往是那些最承受不起的人。

当欧盟把"社会评分"类AI列为"不可接受风险"时，它实际上是在用欧洲的价值观定义全球AI的安全边界。对其他文化背景的社会来说，这种定义本身就可能不公平。更深层的问题是，严格的安全监管会抬高准入门槛，让小企业和发展中国家的创业者被边缘化。以"安全"为名的监管，反而巩固了大企业的垄断地位。这就是"监管俘获"的新形式——大企业不仅不抵触监管，反而积极支持严格监管，因为严监管是抵御竞争对手的最佳壁垒。

欧盟AI法案立法过程有个很有意思的现象：大型科技公司的游说团体在制定监管规则时发挥了巨大影响，而受算法影响最大的边缘群体几乎没有发言权。这就好比一场审判，被告的律师和法官在商量怎么判，受害者连法庭的门都进不了。这种"安全"是谁的安全？这种"公平"是谁的公平？

全球三种路径：谁都在"选两个"

欧盟：安全加公平，创新靠边

欧盟的选择很清晰，公民权利和社会安全放在经济效率前面。背后有历史原因——GDPR的成功让欧洲人相信，严格监管不但不会摧毁创新，反而会通过建立信任促进创新。这个逻辑不能说完全没道理，但现实是残酷的。欧洲AI风投只有美国十分之一左右，这个差距不能全怪监管，但监管的不确定性确实是重要因素。创业者不是不想合规，是不知道怎么合规。规则不明确时，最理性的选择就是不进入。

美国：创新优先，公平缺位

拜登政府发过AI行政命令，强调"安全、安全、安全"，但那是自愿性的，没强制力。Sam Altman去参议院作证时说支持监管，这话听听就好。OpenAI的实际行为——快速发布模型、解散安全团队、和微软深度绑定——展示的是典型的"嘴上说安全、身体很诚实地追求创新"。这不是批评，是资本的逻辑——竞争极度激烈的市场里，谁慢一步谁就可能被淘汰。

问题是美国AI治理中公平的缺位。美国国会听证会上谈AI，焦点永远是"中国威胁"和"AI失控"，几乎从来不谈算法对少数族裔的歧视，不谈自动化对工人的影响。这种话语偏向本身就是一种不公平——它反映了谁的声音被听见，谁的利益被忽略。当一个国家的AI治理议程被国家安全和企业竞争完全主导时，普通人的利益就只能靠边站了。

中国：灵活但模糊的中间路径

中国的做法有自己的特点。《生成式人工智能服务管理暂行办法》采取的是"包容审慎"的态度，没有欧盟那么严，也没有美国那么松。灵活性有其优势，但也有代价。代价就是不确定性。企业不知道今天的"包容"会不会变成明天的"违规"，这种不确定性本身就是对创新的抑制。你可能觉得灵活就是好的，但对创业者来说，确定的坏规则比不确定的好规则更友好。至少你知道边界在哪里。

更值得关注的是，中国的AI治理在公平维度上同样存在模糊地带。当前监管主要关注内容安全和数据安全，这当然很重要，但对算法对劳动者的影响、AI红利的分配问题，目前还缺乏系统性的制度安排。平台经济规模巨大，外卖骑手、网约车司机、快递员这些群体的利益在现有治理框架中几乎没有表达渠道。这是个很大的缺失。

往深处找：为什么这个三角"不可能"

信息不对称：谁都在雾里看花

三难困境的根子之一是信息不对称，这话听着像老生常谈，但在AI领域尤其严重。监管者不完全懂技术，开发者不完全懂风险，公众完全不懂。三重信息不对称叠加在一起，就像三个瞎子摸象——每个人摸到的都是真实的，但没人看到全貌。监管者不知道真实风险有多大，就往往采取最保守的策略，牺牲的是创新；开发者不知道监管底线在哪，就往往先干了再说，牺牲的是安全。

还有一层委托代理的问题。AI系统从开发到影响到人，中间经过好几层：开发者→企业管理层→监管者→政治决策者→公众。每经过一层，信息就失真一次，利益就偏移一次。结果就是所有人都不满意——开发者觉得被绑手绑脚，监管者觉得管不住，公众觉得被出卖。这不是哪个环节的问题，是整个链条的结构性问题。

网络效应和锁定：先到先得，后到没得

AI产业有个特点让事情变得更复杂：强烈的网络效应和锁定效应。一旦一个AI平台起来了，用户、开发者、数据都会被吸过去，越吸越多，越多越吸，形成自我强化的循环。这意味着早期的治理选择有巨大的路径依赖性。一旦某种模式被锁定，再想改就难了。

这就解释了一个现象：各国为什么都在"抢跑"。谁先建立了治理框架，谁就可能成为全球标准的制定者。欧盟通过GDPR已经证明了这种"布鲁塞尔效应"的威力。但这种效应也有代价：当欧洲标准成为全球标准时，其中的价值偏好也被强加给了其他文化背景的社会。这本身就是一种不公平。所以你看，即使是"成功"的治理输出，也带着公平的代价。

公地悲剧：每个人都在做理性选择，结果谁都不好过

从公共经济学的角度看，AI创新有个很大的正外部性问题。开发者赚了钱，但造成的社会成本——失业、歧视、隐私泄露——是全社会在承担。这就像工厂排污，利润是工厂主的，污染是大家的。但监管本身也有正外部性：过度监管会抑制创新，创新受损的代价也是全社会承担的。这就是一个公地悲剧的结构。

在国际层面，这种悲剧表现为"竞争到底"。各国为了争夺AI领导权而放松监管，结果可能是全球性的安全和公平危机。这不是危言耸听，是博弈论的基本结论。当每个人都在做理性选择时，集体结果可能是最差的。全球AI治理协调之所以困难，不是因为各国不懂合作的好处，是因为合作的激励结构本身就有缺陷。你合作了，别人不合作，你就亏了。囚徒困境。

能不能突破？几条可能的路

动态治理：别想一步到位

第一条路是放弃"一步到位"的幻想。不是先设计一套完美规则，而是根据技术发展的不同阶段调整监管侧重点。早期风险不明确时，给创新更多空间；技术成熟了、风险清晰了，再加强安全和公平保障。新加坡的AI Verify框架就是这个思路。

但这条路有个坑：动态治理很容易变成"拖延战术"。以"还需观察"为借口无限期延迟监管，实质上是在牺牲安全和公平换创新空间。所以我觉得，动态治理必须配明确的"触发机制"——风险达到阈值时监管必须自动升级，不能再说"再观察观察"。这就像电梯超载保护，不是不让你载货，是货超过一定重量就必须停下来。

分而治之：别用同一把尺子量所有东西

第二条路是把三难困境拆解成多个小问题。不同AI应用场景的三角形状不一样。医疗AI安全张力最大，出了事是人命；社交算法公平张力最大，影响的是公共话语权；自动驾驶创新张力最大，技术还没成熟。每个领域的突破口不同，不能用同一套规则管所有东西。

欧盟AI法案的风险分级已经在这个方向走了一步，但还不够细。同一个"高风险"等级里，医疗诊断AI和人脸识别AI的治理需求完全不同。更好的方法是"用例驱动"：先解决最紧迫的具体问题，再逐步扩展。比如先解决自动驾驶的责任分配，再解决医疗AI的准入标准，再解决教育AI的公平问题。每一步都可操作，而不是一上来就要解决所有问题。

用AI治理AI：狐狸看鸡舍？

第三条路是用技术手段解决治理问题。DeepMind的"前沿安全框架"和Anthropic的对齐研究都在探索这个方向。逻辑很简单：如果能用更先进的AI监控现有AI的风险，安全和创新就不再是零和博弈。听着很美妙，但我对此持保留态度。

为什么？用AI治理AI会产生新的信任问题。谁保证监控AI本身安全？这就像让狐狸看鸡舍，只不过狐狸更聪明。而且技术手段主要解决安全问题，对公平帮助有限。算法可以检测偏见，但不能定义公平；技术可以提高透明度，但不能替代民主协商。更重要的，技术治理本身也需要资源，这些资源同样会流向大企业，加剧而非缓解不平等。所以这条路能走一段，但走不到底。

最激进的路：重新设计游戏规则

最激进的路，是重新设计游戏规则。现在的治理框架本质上是零和博弈：安全多一分，创新就少一分；公平多一分，效率就少一分。但如果能改变博弈结构，让安全、创新、公平不再是竞争性的目标，而是互助性的目标，三角就可能被突破。

具体来说有几个方向。第一，重新定义创新的方向。如果创新目标不再是"更快更强"，而是"更安全更公平"，那创新和安全、公平就不是对立的。阿奇莫格鲁就曾说过，我们不需要"错误类型的AI"，需要能创造新任务、赋能劳动者的AI。第二，重新设计激励机制。现在创投只看速度和规模，把安全和公平指标也纳入投资决策，创新方向自然会跟着变。第三，重新构建参与机制。现在AI治理是精英博弈，让受影响的普通人参与进来，公平就不再是被动补偿，而是主动设计。

当然，这些都不容易。改变创新方向需要改变投资体系的激励结构，让普通人参与需要改变治理体系的权力结构。这不是一两篇文章能解决的，但我觉得至少应该把问题说清楚。不能因为难就不谈，不谈就永远不会有解决的可能。

最后的话

回到最初的问题：安全、创新、公平能兼得吗？在现有制度框架和激励结构下，完全兼得是不可能的。但这并不意味着我们应该放弃。恰恰相反，正是因为认识到了三难困境的存在，我们才能更清醒地做出权衡和取舍。

三难困境的真正价值不在于宣判"不可能"，而在于揭示"代价"。当我们追求创新时，得清楚我们在牺牲什么；当我们强调安全时，得诚实面对经济代价；当我们呼吁公平时，得明确是谁的公平、按什么标准的公平。只有每个选择的代价都被充分认知和讨论，才能避免最坏的情况——以为自己可以全要，实际什么都没得到。

苏莱曼在《潮涌》里写过一句话："技术的未来不是命定的，但它也不会自动变好。"AI治理的三难困境不是终点，是起点。它要求我们不再幻想三全其美的解决方案，而是踏实地面对权衡与取舍的现实。这或许是我们这个时代最重要的治理课题。

参考文献

[1] Acemoglu, D. & Restrepo, P. (2019). Automation and New Tasks: How Technology Displaces and Reinstates Labor. Journal of Economic Perspectives, 33(2), 3–30.

[2] Acemoglu, D. & Restrepo, P. (2022). Tasks, Automation, and the Rise in US Wage Inequality. Econometrica, 90(5), 1973–2016.

[3] Bostrom, N. (2014). Superintelligence: Paths, Dangers, Strategies. Oxford University Press.

[4] Crawford, K. (2021). Atlas of AI: Power, Politics, and the Planetary Costs of Artificial Intelligence. Yale University Press.

[5] European Parliament & Council. (2024). Regulation (EU) 2024/1689 Laying Down Harmonised Rules on Artificial Intelligence (AI Act).

[6] Mundell, R. A. (1963). Capital Mobility and Stabilization Policy under Fixed and Flexible Exchange Rates. Canadian Journal of Economics and Political Science, 29(4), 475–485.

[7] Nizza, A. (2024). Assessing the Impact of the European AI Act on Innovation Dynamics. Northwestern Law & Economics Research Paper.

[8] O’Neil, C. (2016). Weapons of Math Destruction: How Big Data Increases Inequality and Threatens Democracy. Crown Publishing.

[9] Russell, S. (2019). Human Compatible: Artificial Intelligence and the Problem of Control. Viking Press.

[10] Suleyman, M. (2023). The Coming Wave: Technology, Power, and the Twenty-first Century’s Greatest Dilemma. Crown Publishing.

[11] Zuboff, S. (2019). The Age of Surveillance Capitalism: The Fight for a Human Future at the New Frontier of Power. PublicAffairs.

[12] 国家互联网信息办公室. (2023). 生成式人工智能服务管理暂行办法.

[13] Google DeepMind. (2024). Frontier Safety Framework v2.0.

[14] IMDA, Singapore. (2020). Model AI Governance Framework (2nd Edition).

← 上一篇：AI素养的三个核心维度下一篇：AI浪潮中,个体崛起的新机遇 →