中美携手筑牢AI安全防线：合作势在必行

发布时间：2026-06-06 21:23阅读：36

中美携手筑牢AI安全防线：合作势在必行

Christina Knight

哈佛大学智能设计和工商管理硕士候选人。曾领导Scale AI的安全和政策研究实验室，并担任美国人工智能标准和创新中心的高级政策顾问

Scott Singer

卡内基国际和平基金会技术和国际事务项目研究员

Foreign Affairs

April 7, 2026

导读

随着人工智能深度融入中美经济与战略博弈，该技术也带来了无国界的极端风险。任何个人或组织都可能利用AI模型或组合模型设计危险病原体，攻击电网或医院网络，或制造侵蚀信任的深度伪造内容。因此，AI领域的敌对竞争对中美毫无裨益，任何一方开发的攻击模型都可能引发灾难性后果。

作为变革性AI领域的两大核心国家，华盛顿和北京将决定AI技术是造福大众还是催生新风险。历史经验显示，大国发展高风险技术时，开放沟通渠道对避免灾难性误解至关重要。例如冷战时期，美苏科学家分享了防核滥用的信息。决定共享信息需谨慎，但面对最激烈对手，仍需找到有效合作途径。

中美在竞逐技术霸权之际，必须联手应对AI日益增长的威胁。美国谨慎的风险缓解战略并非放慢创新，而是需与北京合作明确安全研究优先级，协调漏洞测试与保障措施，并共同制定应对全球风险的最佳实践。同时，中国需加大AI安全合作技术的投入。通过聚焦通用风险工具和框架而非具体风险内容，华盛顿和北京可在激烈竞争中减轻给世界带来的潜在极端危险。

直面挑战：中美AI风险政策现状

美中两国均开始重视加强AI供应链安全的必要性。美国正形成分层安全体系：领先AI公司评估极端情况并调整模型；第三方评估者测试可靠性；独立组织开发拦截有害内容的工具；各级政府利用研究结果制定政策。例如商务部和AI安全研究所可在模型发布前要求修复漏洞。

需注意的是，中国目前缺乏同等技术基础设施来衡量和最小化灾难性风险。北京历来重视“内容安全”，即确保AI不产生政治敏感内容。这种狭隘关注正在拓宽，如2026年2月网信办规范类人AI互动以应对成瘾危害。事实上，中国关于AI风险的讨论远超政策行动，2025年9月发布的治理框架呼应了美硅谷关注的问题，如降低生化核武器门槛及自我复制风险，并警告开源基础模型可能助长滥用。

同处阵营：中美合作的挑战与机遇

弥合分歧虽具挑战，却非不可能。如波音与空客竞争但遵守国际航空安全标准，AI竞争也不排除共同基准。美中可通过科学家和实验室交流建立共识和基准。尽管风险定义因法律文化不同，但可就明确威胁两国的全球性威胁达成一致，并制定通用灵活的技术解决方案。

共同基准应基于现有全球努力，如《国际人工智能安全报告》和英美联合测试。中美第二轨道对话也有助于识别共识与分歧。

践行安全共享：实践层面的合作

仅达成风险共识不足以防止全球危害。中美需携手建立降低模型风险的最佳实践，像冷战美苏在核领域那样，在保护专有信息的同时共享信息以减轻全球风险。具体而言，需在检测危险和建立保障措施两方面合作。

在检测实验上，当务之急是构建“红队”——专门测试安全控制的团队以暴露漏洞。需讨论实验设计和扩展红队能力，如使用大型语言模型或让AI代理浏览互联网。分享最佳实践时，应避免透露促进对方发展的具体技术细节。

合作实验需超越数字领域，在现实环境评估。在“湿实验室”代理研究中，AI帮助评估现实风险。应讨论安全协议和替代危险实验的无害实验，聚焦实验框架而非内容。通过讨论框架（如诱导不当行为、泄露数据、获取危险知识），可在不泄露具体方法的情况下建立最佳实践。

除测试外，还需在保障措施上合作。这些机制旨在降低后续风险，但现有措施在复杂攻击时会失效或阻止合法请求。需完善工具以准确区分合法与危险使用，控制模型引发的下游风险。

基于以上讨论，若将合作重点放在AI应用后行为的外部工具建设上，前景切实可行。如讨论内容过滤、执行保护和限制使用等规范性问题，排除专有技术和内部运作机制。由于目前缺乏防范复杂滥用风险的能力，讨论通用框架方法代表有意义进展。

合作领域：未来展望

2024年5月日内瓦首次中美政府AI对话因专业知识和优先事项不匹配而失败。美方派技术专家，中方关注外交政策和芯片控制。华盛顿关注技术风险，北京关注政治风险。

当前最需的是在双边关系波动之外，展开关于全球AI风险的有限、稳定对话。这符合双方利益，但需创造力。有希望的方法是让与政府有关联的第三方专家参与，如中国AI安全与发展协会成员。将技术专家与接近政府权力的人聚集，能建立共同技术话语，同时聚焦官方讨论。

同时，与其他有技术专长且与美中关系良好的国家合作，如英国利用其AI安全研究所分别与两国会晤，可弥合分歧。

成功对话将帮助政策制定者在不扼杀创新的情况下洞察危险活动。投资合作有助于识别新兴模式风险，完善保障措施，并促进公司、政府和国际用户对已知及未知风险的把握，增强透明度。唯有合作，美中才能理解并缓解威胁双方的系统性AI风险。

译者：景梦欣，国政学人编译员，陕西师范大学国家安全学院。

← 上一篇：智能技术解锁土壤碳储量新纪元下一篇：AI日报：Anthropic呼吁踩刹车，965亿估值上市，华为国产算力获突破 →