AI治理的深层困局:难以兼顾的三重目标
先讲个真实发生的事。去年六月,布鲁塞尔,一场闭门会议。欧盟数字司官员旁边坐着一位从硅谷归来的创业者,桌上放着咖啡和矿泉水——谁都没碰。话题转到AI监管,欧盟那位表态"宁可用慢也要稳妥",创业者立刻反驳:"你们慢一点,我们就倒下一批。"全场沉默了大约五秒。这个场景。不是谁对谁错的问题——双方都有道理,这才是棘手之处。经济学中有个经典概念叫"三难困境",蒙代尔1963年提出:资本自由流动、固定汇率、独立货币政策,三选二。我越深入研究越意识到,AI治理同样存在自己的三难困境:安全、创新、公平,你最多只能同时兼顾两个。别急,我知道你想问"为什么不能全要"。继续往下看。
先把三个维度说清楚
安全:不只是担心机器人反叛
每次讨论AI安全,总有人不以为然。有学生就问过:"老师,机器人又不是终结者,您担心什么?"罗素2019年那本《人类兼容》说得很清楚——真正可怕的并非AI"想要"伤害人,而是一个足够聪明的系统在执行任务时,人类已经无法介入。你给它设定一个目标,它就会用你完全预料不到的方式去实现。这不需要恶意,只需要能力足够强、目标足够模糊。
但"安全"这个词太宽泛了,宽泛到容易被当作大棒。什么都往里装——深度伪造是安全问题,算法歧视是安全问题,数据泄露是安全问题,自主武器也是安全问题。都没错。但它们的性质完全不同,用同一套监管工具去应对,本身就不够安全。我常跟学生说,讨论AI安全之前先弄明白你在讨论哪种安全,否则就是不负责任。
还有一点很少有人提到:安全的代价不是均匀分布的。北京写代码的程序员和贵州山区被信贷算法拒绝的农民,他们面对的AI风险根本不在一个量级。前者担心工作被取代,后者担心生活来源被切断。在办公室里讨论"AI安全",最容易被忽视的恰恰是那些最脆弱群体面临的风险。
创新:方向比速度更关键
创新这个词在AI行业已经用滥了。每次大模型发布,新闻稿必有"突破性创新"——好像不加这句话产品就不完整似的。但有个很基本的问题:创新的方向和创新的速度,哪个更重要?
阿奇莫格鲁和雷斯特雷波2019年那篇论文把这件事讲得很透彻。他们指出技术进步对劳动者的影响取决于两股力量的竞争:自动化在替代旧任务,新技术在创造新任务。替代跑得比创造快,劳动者就吃亏。创造跑得比替代快,大家都能受益。简洁有力,解释力极强。你看现在那些大厂发布会,开口就是"替代人类工作",很少有人提"创造新岗位"。这不是偏见,是资本的逻辑——替代人的回报周期短,创造新岗位的回报周期长且充满不确定。
还有一层。所谓创新,到底是谁在创新?训练一个大模型往往需要上亿美元算力,创新越来越成为少数人的专利。以前大学生在车库里就能创业,现在博士在实验室里可能都玩不起。创新的民主化程度在下降——这本身就是安全问题,也是公平问题。你看,三个维度已经开始互相交织了。
公平:谁来分配成果
公平是三个目标中最模糊的,也最容易被操控。你问十个人什么叫公平,能得到十一种答案。克罗福德在《AI地图》里说了句大实话:AI的发展本质上是权力的重新分配。谁有数据,谁有算力,谁写算法,谁就掌握了定义"公平"的权力。听着刺耳,但经得起检验。
举个具体的例子。美国信贷算法对少数族裔的歧视,被讨论过无数遍。但有个细节很少被提到:当政府要求算法"公平"时,银行的第一反应不是修复歧视,是让算法变得更不透明。为什么?因为"公平"的定义权在他们手里。他们可以说算法已经"优化"了,你看这个指标已经达标。但达标的是谁的标准?谁定义的公平?这个问题没有技术答案,只有政治答案。
所以我说公平的问题不是"分蛋糕",是"谁来切"。切蛋糕的人永远会给自己留最大的一块——这不是道德问题,是结构性问题。在AI领域,切蛋糕的人就是那些掌握技术和资本的少数人。让一群年薪百万的工程师来定义什么对一个月薪三千的外卖骑手是"公平"的,这本身就很荒诞。
三个维度:每两个目标都在相互制约
安全和创新:最明显的矛盾
欧盟《AI法案》出台后,我跟好几个欧洲同行聊过,反馈出奇一致:法案本身没什么大问题,问题在于执行。举个细节——法案要求高风险AI上市前进行合规评估。听起来很合理对吧?但谁来评估?标准是什么?评估一次要多久、要花多少钱?这些问题法案里都没有明确答案。结果就是,大企业请得起律师团队,小企业只能无奈选择"我还是不进欧洲市场了吧"。
西北大学法学院的研究直接指出了这个问题:欧盟AI法案的合规成本会不成比例地影响中小企业。这不是什么新发现,GDPR时就已经证明过一次了。严格监管最终往往变成大企业的护城河,因为只有大企业才承担得起合规成本。古典经济学里叫"监管俘获"——不是说监管不对,是说监管的效果可能和初衷背道而驰。
特别想强调一点:安全监管的边际成本极高。什么意思?当你要求一个AI系统证明自己"安全"时,你实际上是在要求它证明一个负命题——证明自己"不会出事"。这在逻辑上几乎不可能完成,因为你永远无法穷尽所有可能的风险场景。结果就是合规审查变成了一场没有尽头的猫鼠游戏,消耗的是创新的时间和资源。
创新和公平:"先发展再说"的陷阱
这组矛盾更隐蔽,危害性一点不小。东南亚有个做外卖配送的平台,用AI算法分配订单和定价。创始人说,算法让效率提升了40%,但骑手收入反而下降了。为什么?算法在优化整体效率时,把订单集中给了"更高效"的骑手——年轻的、健康的、算法觉得"更值得投资"的人。年纪大的、身体不好的骑手就被慢慢排挤出去了。这就是创新和公平的矛盾在现实中的样子——不是宏大叙事,就是一个个具体的人被算法慢慢地排挤。
祖博夫在《监控资本主义》里提了个很有力的概念叫"路径依赖"。一旦一个技术体系被建立起来,所有人都被迫适应它,不管你愿不愿意。你不用这个算法,你就没单接;你不接受这个定价,你就没活干。"先发展再说"的逻辑在这里就破产了——等你发展完再想修补公平,被排挤的人已经回不来了。这不是"先有鸡还是先有蛋",是鸡和蛋都在崩溃。
阿奇莫格鲁和雷斯特雷波的实证也印证了这一点。自动化对美国劳动力市场的主要影响是"任务替代"而非"任务创造"。这意味着自动化的红利主要流向了资本,不是劳动。创新在加速,但果实不是均匀分布的。这是结构性问题,不是"技能培训"或"社会保障"能解决的。
安全和公平:谁的安全?谁的公平?
这组矛盾是三个维度里最少被讨论的,但我觉得可能是最重要的。问题很简单:安全监管的成本是谁在承担?往往是那些最承受不起的人。
当欧盟把"社会评分"类AI列为"不可接受风险"时,它实际上是在用欧洲的价值观定义全球AI的安全边界。对其他文化背景的社会来说,这种定义本身就可能不公平。更深层的问题是,严格的安全监管会抬高准入门槛,让小企业和发展中国家的创业者被边缘化。以"安全"为名的监管,反而巩固了大企业的垄断地位。这就是"监管俘获"的新形式——大企业不仅不抵触监管,反而积极支持严格监管,因为严监管是抵御竞争对手的最佳壁垒。
欧盟AI法案立法过程有个很有意思的现象:大型科技公司的游说团体在制定监管规则时发挥了巨大影响,而受算法影响最大的边缘群体几乎没有发言权。这就好比一场审判,被告的律师和法官在商量怎么判,受害者连法庭的门都进不了。这种"安全"是谁的安全?这种"公平"是谁的公平?
全球三种路径:谁都在"选两个"
欧盟:安全加公平,创新靠边
欧盟的选择很清晰,公民权利和社会安全放在经济效率前面。背后有历史原因——GDPR的成功让欧洲人相信,严格监管不但不会摧毁创新,反而会通过建立信任促进创新。这个逻辑不能说完全没道理,但现实是残酷的。欧洲AI风投只有美国十分之一左右,这个差距不能全怪监管,但监管的不确定性确实是重要因素。创业者不是不想合规,是不知道怎么合规。规则不明确时,最理性的选择就是不进入。
美国:创新优先,公平缺位
拜登政府发过AI行政命令,强调"安全、安全、安全",但那是自愿性的,没强制力。Sam Altman去参议院作证时说支持监管,这话听听就好。OpenAI的实际行为——快速发布模型、解散安全团队、和微软深度绑定——展示的是典型的"嘴上说安全、身体很诚实地追求创新"。这不是批评,是资本的逻辑——竞争极度激烈的市场里,谁慢一步谁就可能被淘汰。
问题是美国AI治理中公平的缺位。美国国会听证会上谈AI,焦点永远是"中国威胁"和"AI失控",几乎从来不谈算法对少数族裔的歧视,不谈自动化对工人的影响。这种话语偏向本身就是一种不公平——它反映了谁的声音被听见,谁的利益被忽略。当一个国家的AI治理议程被国家安全和企业竞争完全主导时,普通人的利益就只能靠边站了。
中国:灵活但模糊的中间路径
中国的做法有自己的特点。《生成式人工智能服务管理暂行办法》采取的是"包容审慎"的态度,没有欧盟那么严,也没有美国那么松。灵活性有其优势,但也有代价。代价就是不确定性。企业不知道今天的"包容"会不会变成明天的"违规",这种不确定性本身就是对创新的抑制。你可能觉得灵活就是好的,但对创业者来说,确定的坏规则比不确定的好规则更友好。至少你知道边界在哪里。
更值得关注的是,中国的AI治理在公平维度上同样存在模糊地带。当前监管主要关注内容安全和数据安全,这当然很重要,但对算法对劳动者的影响、AI红利的分配问题,目前还缺乏系统性的制度安排。平台经济规模巨大,外卖骑手、网约车司机、快递员这些群体的利益在现有治理框架中几乎没有表达渠道。这是个很大的缺失。
往深处找:为什么这个三角"不可能"
信息不对称:谁都在雾里看花
三难困境的根子之一是信息不对称,这话听着像老生常谈,但在AI领域尤其严重。监管者不完全懂技术,开发者不完全懂风险,公众完全不懂。三重信息不对称叠加在一起,就像三个瞎子摸象——每个人摸到的都是真实的,但没人看到全貌。监管者不知道真实风险有多大,就往往采取最保守的策略,牺牲的是创新;开发者不知道监管底线在哪,就往往先干了再说,牺牲的是安全。
还有一层委托代理的问题。AI系统从开发到影响到人,中间经过好几层:开发者→企业管理层→监管者→政治决策者→公众。每经过一层,信息就失真一次,利益就偏移一次。结果就是所有人都不满意——开发者觉得被绑手绑脚,监管者觉得管不住,公众觉得被出卖。这不是哪个环节的问题,是整个链条的结构性问题。
网络效应和锁定:先到先得,后到没得
AI产业有个特点让事情变得更复杂:强烈的网络效应和锁定效应。一旦一个AI平台起来了,用户、开发者、数据都会被吸过去,越吸越多,越多越吸,形成自我强化的循环。这意味着早期的治理选择有巨大的路径依赖性。一旦某种模式被锁定,再想改就难了。
这就解释了一个现象:各国为什么都在"抢跑"。谁先建立了治理框架,谁就可能成为全球标准的制定者。欧盟通过GDPR已经证明了这种"布鲁塞尔效应"的威力。但这种效应也有代价:当欧洲标准成为全球标准时,其中的价值偏好也被强加给了其他文化背景的社会。这本身就是一种不公平。所以你看,即使是"成功"的治理输出,也带着公平的代价。
公地悲剧:每个人都在做理性选择,结果谁都不好过
从公共经济学的角度看,AI创新有个很大的正外部性问题。开发者赚了钱,但造成的社会成本——失业、歧视、隐私泄露——是全社会在承担。这就像工厂排污,利润是工厂主的,污染是大家的。但监管本身也有正外部性:过度监管会抑制创新,创新受损的代价也是全社会承担的。这就是一个公地悲剧的结构。
在国际层面,这种悲剧表现为"竞争到底"。各国为了争夺AI领导权而放松监管,结果可能是全球性的安全和公平危机。这不是危言耸听,是博弈论的基本结论。当每个人都在做理性选择时,集体结果可能是最差的。全球AI治理协调之所以困难,不是因为各国不懂合作的好处,是因为合作的激励结构本身就有缺陷。你合作了,别人不合作,你就亏了。囚徒困境。
能不能突破?几条可能的路
动态治理:别想一步到位
第一条路是放弃"一步到位"的幻想。不是先设计一套完美规则,而是根据技术发展的不同阶段调整监管侧重点。早期风险不明确时,给创新更多空间;技术成熟了、风险清晰了,再加强安全和公平保障。新加坡的AI Verify框架就是这个思路。
但这条路有个坑:动态治理很容易变成"拖延战术"。以"还需观察"为借口无限期延迟监管,实质上是在牺牲安全和公平换创新空间。所以我觉得,动态治理必须配明确的"触发机制"——风险达到阈值时监管必须自动升级,不能再说"再观察观察"。这就像电梯超载保护,不是不让你载货,是货超过一定重量就必须停下来。
分而治之:别用同一把尺子量所有东西
第二条路是把三难困境拆解成多个小问题。不同AI应用场景的三角形状不一样。医疗AI安全张力最大,出了事是人命;社交算法公平张力最大,影响的是公共话语权;自动驾驶创新张力最大,技术还没成熟。每个领域的突破口不同,不能用同一套规则管所有东西。
欧盟AI法案的风险分级已经在这个方向走了一步,但还不够细。同一个"高风险"等级里,医疗诊断AI和人脸识别AI的治理需求完全不同。更好的方法是"用例驱动":先解决最紧迫的具体问题,再逐步扩展。比如先解决自动驾驶的责任分配,再解决医疗AI的准入标准,再解决教育AI的公平问题。每一步都可操作,而不是一上来就要解决所有问题。
用AI治理AI:狐狸看鸡舍?
第三条路是用技术手段解决治理问题。DeepMind的"前沿安全框架"和Anthropic的对齐研究都在探索这个方向。逻辑很简单:如果能用更先进的AI监控现有AI的风险,安全和创新就不再是零和博弈。听着很美妙,但我对此持保留态度。
为什么?用AI治理AI会产生新的信任问题。谁保证监控AI本身安全?这就像让狐狸看鸡舍,只不过狐狸更聪明。而且技术手段主要解决安全问题,对公平帮助有限。算法可以检测偏见,但不能定义公平;技术可以提高透明度,但不能替代民主协商。更重要的,技术治理本身也需要资源,这些资源同样会流向大企业,加剧而非缓解不平等。所以这条路能走一段,但走不到底。
最激进的路:重新设计游戏规则
最激进的路,是重新设计游戏规则。现在的治理框架本质上是零和博弈:安全多一分,创新就少一分;公平多一分,效率就少一分。但如果能改变博弈结构,让安全、创新、公平不再是竞争性的目标,而是互助性的目标,三角就可能被突破。
具体来说有几个方向。第一,重新定义创新的方向。如果创新目标不再是"更快更强",而是"更安全更公平",那创新和安全、公平就不是对立的。阿奇莫格鲁就曾说过,我们不需要"错误类型的AI",需要能创造新任务、赋能劳动者的AI。第二,重新设计激励机制。现在创投只看速度和规模,把安全和公平指标也纳入投资决策,创新方向自然会跟着变。第三,重新构建参与机制。现在AI治理是精英博弈,让受影响的普通人参与进来,公平就不再是被动补偿,而是主动设计。
当然,这些都不容易。改变创新方向需要改变投资体系的激励结构,让普通人参与需要改变治理体系的权力结构。这不是一两篇文章能解决的,但我觉得至少应该把问题说清楚。不能因为难就不谈,不谈就永远不会有解决的可能。
最后的话
回到最初的问题:安全、创新、公平能兼得吗?在现有制度框架和激励结构下,完全兼得是不可能的。但这并不意味着我们应该放弃。恰恰相反,正是因为认识到了三难困境的存在,我们才能更清醒地做出权衡和取舍。
三难困境的真正价值不在于宣判"不可能",而在于揭示"代价"。当我们追求创新时,得清楚我们在牺牲什么;当我们强调安全时,得诚实面对经济代价;当我们呼吁公平时,得明确是谁的公平、按什么标准的公平。只有每个选择的代价都被充分认知和讨论,才能避免最坏的情况——以为自己可以全要,实际什么都没得到。
苏莱曼在《潮涌》里写过一句话:"技术的未来不是命定的,但它也不会自动变好。"AI治理的三难困境不是终点,是起点。它要求我们不再幻想三全其美的解决方案,而是踏实地面对权衡与取舍的现实。这或许是我们这个时代最重要的治理课题。
参考文献
[1] Acemoglu, D. & Restrepo, P. (2019). Automation and New Tasks: How Technology Displaces and Reinstates Labor. Journal of Economic Perspectives, 33(2), 3–30.
[2] Acemoglu, D. & Restrepo, P. (2022). Tasks, Automation, and the Rise in US Wage Inequality. Econometrica, 90(5), 1973–2016.
[3] Bostrom, N. (2014). Superintelligence: Paths, Dangers, Strategies. Oxford University Press.
[4] Crawford, K. (2021). Atlas of AI: Power, Politics, and the Planetary Costs of Artificial Intelligence. Yale University Press.
[5] European Parliament & Council. (2024). Regulation (EU) 2024/1689 Laying Down Harmonised Rules on Artificial Intelligence (AI Act).
[6] Mundell, R. A. (1963). Capital Mobility and Stabilization Policy under Fixed and Flexible Exchange Rates. Canadian Journal of Economics and Political Science, 29(4), 475–485.
[7] Nizza, A. (2024). Assessing the Impact of the European AI Act on Innovation Dynamics. Northwestern Law & Economics Research Paper.
[8] O’Neil, C. (2016). Weapons of Math Destruction: How Big Data Increases Inequality and Threatens Democracy. Crown Publishing.
[9] Russell, S. (2019). Human Compatible: Artificial Intelligence and the Problem of Control. Viking Press.
[10] Suleyman, M. (2023). The Coming Wave: Technology, Power, and the Twenty-first Century’s Greatest Dilemma. Crown Publishing.
[11] Zuboff, S. (2019). The Age of Surveillance Capitalism: The Fight for a Human Future at the New Frontier of Power. PublicAffairs.
[12] 国家互联网信息办公室. (2023). 生成式人工智能服务管理暂行办法.
[13] Google DeepMind. (2024). Frontier Safety Framework v2.0.
[14] IMDA, Singapore. (2020). Model AI Governance Framework (2nd Edition).