标签

中美携手筑牢AI安全防线:合作势在必行

发布时间:2026-06-06 21:23来源:微信阅读:2

中美携手筑牢AI安全防线:合作势在必行

Christina Knight

哈佛大学智能设计和工商管理硕士候选人。曾领导Scale AI的安全和政策研究实验室,并担任美国人工智能标准和创新中心的高级政策顾问

Scott Singer

卡内基国际和平基金会技术和国际事务项目研究员

Foreign Affairs

April 7, 2026

导读

随着人工智能深度融入中美经济与战略博弈,该技术也带来了无国界的极端风险。任何个人或组织都可能利用AI模型或组合模型设计危险病原体,攻击电网或医院网络,或制造侵蚀信任的深度伪造内容。因此,AI领域的敌对竞争对中美毫无裨益,任何一方开发的攻击模型都可能引发灾难性后果。

作为变革性AI领域的两大核心国家,华盛顿和北京将决定AI技术是造福大众还是催生新风险。历史经验显示,大国发展高风险技术时,开放沟通渠道对避免灾难性误解至关重要。例如冷战时期,美苏科学家分享了防核滥用的信息。决定共享信息需谨慎,但面对最激烈对手,仍需找到有效合作途径。

中美在竞逐技术霸权之际,必须联手应对AI日益增长的威胁。美国谨慎的风险缓解战略并非放慢创新,而是需与北京合作明确安全研究优先级,协调漏洞测试与保障措施,并共同制定应对全球风险的最佳实践。同时,中国需加大AI安全合作技术的投入。通过聚焦通用风险工具和框架而非具体风险内容,华盛顿和北京可在激烈竞争中减轻给世界带来的潜在极端危险。

直面挑战:中美AI风险政策现状

美中两国均开始重视加强AI供应链安全的必要性。美国正形成分层安全体系:领先AI公司评估极端情况并调整模型;第三方评估者测试可靠性;独立组织开发拦截有害内容的工具;各级政府利用研究结果制定政策。例如商务部和AI安全研究所可在模型发布前要求修复漏洞。

需注意的是,中国目前缺乏同等技术基础设施来衡量和最小化灾难性风险。北京历来重视“内容安全”,即确保AI不产生政治敏感内容。这种狭隘关注正在拓宽,如2026年2月网信办规范类人AI互动以应对成瘾危害。事实上,中国关于AI风险的讨论远超政策行动,2025年9月发布的治理框架呼应了美硅谷关注的问题,如降低生化核武器门槛及自我复制风险,并警告开源基础模型可能助长滥用。

同处阵营:中美合作的挑战与机遇

弥合分歧虽具挑战,却非不可能。如波音与空客竞争但遵守国际航空安全标准,AI竞争也不排除共同基准。美中可通过科学家和实验室交流建立共识和基准。尽管风险定义因法律文化不同,但可就明确威胁两国的全球性威胁达成一致,并制定通用灵活的技术解决方案。

共同基准应基于现有全球努力,如《国际人工智能安全报告》和英美联合测试。中美第二轨道对话也有助于识别共识与分歧。

践行安全共享:实践层面的合作

仅达成风险共识不足以防止全球危害。中美需携手建立降低模型风险的最佳实践,像冷战美苏在核领域那样,在保护专有信息的同时共享信息以减轻全球风险。具体而言,需在检测危险和建立保障措施两方面合作。

在检测实验上,当务之急是构建“红队”——专门测试安全控制的团队以暴露漏洞。需讨论实验设计和扩展红队能力,如使用大型语言模型或让AI代理浏览互联网。分享最佳实践时,应避免透露促进对方发展的具体技术细节。

合作实验需超越数字领域,在现实环境评估。在“湿实验室”代理研究中,AI帮助评估现实风险。应讨论安全协议和替代危险实验的无害实验,聚焦实验框架而非内容。通过讨论框架(如诱导不当行为、泄露数据、获取危险知识),可在不泄露具体方法的情况下建立最佳实践。

除测试外,还需在保障措施上合作。这些机制旨在降低后续风险,但现有措施在复杂攻击时会失效或阻止合法请求。需完善工具以准确区分合法与危险使用,控制模型引发的下游风险。

基于以上讨论,若将合作重点放在AI应用后行为的外部工具建设上,前景切实可行。如讨论内容过滤、执行保护和限制使用等规范性问题,排除专有技术和内部运作机制。由于目前缺乏防范复杂滥用风险的能力,讨论通用框架方法代表有意义进展。

合作领域:未来展望

2024年5月日内瓦首次中美政府AI对话因专业知识和优先事项不匹配而失败。美方派技术专家,中方关注外交政策和芯片控制。华盛顿关注技术风险,北京关注政治风险。

当前最需的是在双边关系波动之外,展开关于全球AI风险的有限、稳定对话。这符合双方利益,但需创造力。有希望的方法是让与政府有关联的第三方专家参与,如中国AI安全与发展协会成员。将技术专家与接近政府权力的人聚集,能建立共同技术话语,同时聚焦官方讨论。

同时,与其他有技术专长且与美中关系良好的国家合作,如英国利用其AI安全研究所分别与两国会晤,可弥合分歧。

成功对话将帮助政策制定者在不扼杀创新的情况下洞察危险活动。投资合作有助于识别新兴模式风险,完善保障措施,并促进公司、政府和国际用户对已知及未知风险的把握,增强透明度。唯有合作,美中才能理解并缓解威胁双方的系统性AI风险。

译者:景梦欣,国政学人编译员,陕西师范大学国家安全学院。