美国AI监管再定调：从放手到先审后发

发布时间：2026-05-06 18:04阅读：11

2026年5月4日，《纽约时报》报道白宫内部正酝酿一份行政命令，计划在联邦层面组建AI工作组，要求对新一代AI模型在公开发布前先进行强制性审查（pre-release vetting）。Anthropic、Google、OpenAI三家头部公司已收到白宫通报。幕僚长Susie Wiles甚至已与Anthropic的CEO Dario Amodei进行会面，沟通配合的细节。随后，Forbes、Axios、Reuters、Bloomberg、《华尔街日报》等媒体陆续证实相关进展。回看2025年1月20日，特朗普重返白宫的首日便高调撤销拜登政府的第14110号行政令，该令要求大模型开发者向联邦政府提交安全测试结果。撤销之后，特朗普在2025年7月推出《美国AI行动计划》（America's AI Action Plan），整体围绕"放松管制、加速创新、赢得对华AI竞赛"展开。一年多时间内，同届政府、同一位总统在AI监管立场上完成了从"放手不管"到"先审后发"的急剧转向。

笔者认为，这次转变所要传递的关键在于：AI大模型已从单纯的技术产品成长为新型生产要素，其能力边界所指向的安全风险，已经逼近任何主权国家都难以承受的红线。对AI企业、出海中国厂商以及法务负责人而言，与其反复评估特朗普的摇摆，不如把重点放在"先审后发"落地后，自己手中产品与合同的权利义务可能如何改变。

一、政策急转弯背后：被一个叫Mythos的模型逼出来的

要弄清白宫为何会改口，得先回答到底是什么因素把它推向新路径。直接触发点来自Anthropic的"Mythos"模型：它在识别软件安全漏洞方面的表现强到什么程度？连Anthropic自己都公开提示，相关能力可能引发全球范围的网络安全"清算"（cybersecurity reckoning）。换成更直白的话讲——一旦被恶意使用，它就像超级开锁器：几小时内，全球关键软件系统、银行核心、电网调度、医院信息系统中的漏洞可能被成批挖掘出来。Mythos目前被Anthropic主动限制在仅50个实体范围内调用，而白宫同时明确反对其继续扩大授权范围。值得注意的是，阻力来自白宫，而非Anthropic出于商业考虑不愿开放。

这个细节反映出更深层的问题：模型能力的上限，已经不再主要由开发者的商业动机来决定，而是开始由国家安全机构来进行设定。正是在白宫充分理解Mythos能力边界之后，特朗普团队意识到一个棘手事实——他们在2025年初撤销拜登行政令时所设想的"AI不过是新型搜索引擎，让市场去跑"的解释方式，已难以覆盖眼前的现实。一个公司发布的模型，可能在短时间内重塑全球网络安全的攻防格局；这不再只是市场层面的效率问题，更接近国家安全议题。于是政府必须面对两难：继续坚持"不干预"，等到首个重大网络安全事件发生后再被国会与舆论追问"当时为何放任"；或是提前出手，在发布前建立"先审后发"的过滤机制，把最危险的能力锁进审查笼子。就政治逻辑而言，后者更符合理性政府的选择。

因此，这轮政策急转弯真正的逻辑并非来自特朗普忽然"重视安全"，而是Mythos用具体能力证明了什么叫做"能力过载"，从而让原本站在口号层面的"放手论"在事实面前失去支撑。

二、商业逻辑被改写：当模型"太强"反而卖不出去

在过去十年的互联网叙事里，一个基本共识是：技术越强，产品越值钱。但Mythos事件首次把一个看似反常识的命题摆到台前——模型强到一定程度，反而可能失去正常商业化的资格。由此，AI行业可能正在形成一种新的市场结构：在中低能力区间，模型仍可按传统SaaS思路销售订阅、按调用量计费；但当能力越过某个阈值（例如能在分钟级挖掘零日漏洞、能合成具备传染性的生物分子、能自动操控关键工业控制系统），它就会被强行从商业轨道拖入类似军工受控物资的特殊路径。

这条新规则会从三个层面重塑产业生态：

第一，研发完成到对外开放API之间的"缓冲期"将被监管硬拉长。过去从训练结束到开放接口可能是一日内完成；而在"先审后发"框架下，节奏会被拆分为：训练完成→内部红队测试→提交政府审查→多轮迭代修改→拿到发布许可→再分级开放。每增加一道环节，资金占用与时间成本都会上升。对烧钱的大模型公司来说，这种"延迟变现"足以直接改变公司的财务结构。

第二，模型能力指标与合规通过率可能出现倒挂。以前AI公司更看重benchmark分数，越高越好；之后则可能出现一种新的尴尬：分数越高，反而越可能通不过审。这会迫使企业在一开始的训练目标设定中就内嵌"可控性"、"可解释性"以及对危险能力的可削弱性，而不是等到后续再用RLHF（基于人类反馈的强化学习）补补丁。对中国大模型团队而言，这点尤其需要警惕：过去我们更熟悉"先把能力做出来再谈安全"的路径。

第三，头部寡头效应将进一步被放大。能够在白宫、商务部、能源部等多方反复沟通审查方案的，通常只有极少数公司。中小创业团队再聪明，也难以调动资源去对接联邦层面的审查流程。Mythos事件后，能与白宫直接对话的Anthropic、OpenAI、Google已经提前锁定未来数年的政策红利位置。其他企业若想进入赛道，可能得先通过这些头部公司把诉求转达过去。

三、监管底层逻辑：从"避风港"到"准入许可"

从法律实务看，更值得被关注的并不是单次政策变化本身，而是监管范式的底层切换。互联网时代的监管思路，无论是中国的"通知—删除"，还是美国的DMCA"安全港"，核心都在于"先发展、后治理"：技术被视为中性的，只要平台没有明显过错，就先让市场试错，出了问题再用诉讼和行政处罚去纠偏。在内容、电商、社交平台时代，这套逻辑相对顺畅。但当面对的是Mythos级别的模型时，它第一次出现了根本性失灵。原因很直接——AI模型造成的破坏往往是系统性、不可逆且跨境传导的，事后即便赔偿与处罚再重，也无法把已经造成的损害追回或抵消。企业被罚到破产，也不会让因其模型摧毁的电网立刻恢复供电。于是监管者被逼到墙角：要么放弃监管，要么把监管前移到产品诞生之前。

白宫本次拟参考的路径，恰好接近英国AI安全研究所（UK AI Safety Institute）的模式：由政府牵头对前沿模型进行能力评估，重点判断其在关键风险领域（CBRN：化学、生物、放射、核；网络攻击；自主复制等）是否具备"危险能力"，再决定是否允许公开发布。如果美国版本照搬该机制，那么美国AI监管将完成三项核心切换：监管介入时点从互联网时代的产品上线之后转到产品发布之前；审查主体由法院与行政机关的被动响应，改为由政府AI工作组主动评估；追责方式则从事后追责走向准入许可与明确责任配置——其中平台过错责任为主，转为开发者绝对责任叠加。笔者特别提醒法务负责人关注第四行："绝对责任"。一旦"先审后发"机制成型，未经审查擅自公开高风险模型，或在审查中隐瞒能力数据，就不再只是"过错责任"的争议，而可能触发行政强制下架、刑事追责，甚至切断算力供应和政府订单。这样的制裁组合带来的冲击，远超普通民事侵权赔偿。

四、给中国AI企业的启示

白宫这次大转向，给国内AI产业与法律实务的影响，可能比许多人预期的更直接、更具体。

第一点：不要再幻想"美国管得松"。过去两年里，国内部分AI从业者存在一种典型心态：认为国内监管更严，去美国就能更自由。特朗普2025年初撤销拜登14110号令时，这种想法被推到顶峰。但Mythos事件已经把这种幻觉打破：一旦牵涉国家级安全风险，所谓"放松管制"会在极短时间内重回"严格审查"轨道；党派立场与意识形态在国家安全面前会让位。中国企业制定出海合规方案时，需要以"未来三年美国监管会显著收紧"作为新的基线，而不是沿用2025年7月那份《AI行动计划》的乐观表述来规划。

第二点：合规能力将越来越直接地影响AI公司的估值。过去合规部门在不少AI公司中地位尴尬，常被看成"踩刹车的成本中心"。但当"先审后发"成为美国、英国乃至欧盟（《人工智能法案》已生效）、中国（《生成式人工智能服务管理暂行办法》）的共同方向时，谁能更快、更稳地通过监管审查，谁就能更早把模型转化为可持续的现金流。法务、合规与安全评估团队也会从成本中心转向影响估值的关键一环。并非危言耸听——医药行业用了三十年左右完成类似调整，AI行业可能在三年左右就会把路径压缩走完。

第三点：出海企业需重新评估"模型出口"的法律属性。若美国把AI模型纳入"先审后发"框架，再叠加既有出口管制体系（EAR、ECCN分类），中国AI公司向海外提供模型API、开放权重，乃至向海外用户提供SaaS服务时，所适用的法律性质可能会发生实质变化：从单纯的数字服务，转向一种受双边管制的战略资源。因此，不仅要在国内完成备案、做安全评估，还要在每一目的地国家开展"对方政府是否准入"的尽调。对任何模型授权合同进行法律审查，都需要新增核心环节：确认对方国家针对该等级模型是否有准入或审查要求，以及这些要求由谁承担合规成本。

五、结语：戴着镣铐起跑的下一阶段

必须先把话说在前面：白宫这次转向的具体路径仍存在不小的不确定性。行政命令的最终文本、审查机构的法律定位、以及与现有出口管制和国家安全机制的衔接方式，仍在博弈中。Mythos只是导火索，并不等于终局。但有一点已经相当确定：AI产业野蛮生长的窗口期正在快速收拢。"先审后发"不会只停留在美国：一旦由白宫确立，它将通过G7、OECD、《布莱切利宣言》后续会议等机制扩散，成为发达经济体的共同标准。中国监管层面对前沿大模型的备案、安全评估、能力分级审查，实际上也在朝着同一方向推进。差异主要在节奏，而不在方向。

对企业决策者而言，当前最值得优先做的三件事很明确：第一，重新梳理手中每一款模型在未来12个月内可能被归入的"高风险类别"，提前准备降级方案与能力分层架构；第二，把法务、合规以及安全评估团队的预算与话语权提升到与算力投入同等的优先等级；第三，对所有涉及海外发布与海外授权的合同，立刻补充"监管审查不可抗力"以及"政府准入获取成本分担"两类条款。放任式的AI时代正走向终结。下一阶段，是戴着镣铐起跑的时代。谁能最先看清这一点，谁就能把镣铐转化为自己的护城河。

← 上一篇：AI新动向：可靠性、使用量与监管并行下一篇：首届AI大会聚焦具身智能与新质生产力 →