标签

效仿新药审批,美国将实施AI模型前置审查

发布时间:2026-05-06 08:27来源:微信阅读:5

美国正加快构建针对人工智能的“发布前监管”体系。

据路透社及《华盛顿邮报》消息,Google、微软和xAI已同意向美方提供未公开发布的AI模型,供其在正式发布前接受国家安全层面的评估,这标志着全球AI治理正从事后监管向事前审查转变。

根据相关安排,美国商务部下属机构

该机构前身是2023年成立的U.S. AI Safety Institute(AI安全研究所),随后于2025年重组并更名为现在的CAISI。

此次测试的重点已不再局限于数据隐私或算法偏见,而是扩展到了网络攻击能力、生物化学安全风险以及大规模信息操控等更具战略意义的领域。

对此,微软声明表示,将与美方科研人员合作,通过探测未知异常行为来测试人工智能系统。

微软还指出,双方将共同构建通用测试数据集和标准化流程,以用于自家AI模型的安全检测。

声明还透露,微软已与英国AI安全研究所签署了类似的合作协议。

值得注意的是,参与评估的模型通常会在放宽部分安全限制的情况下提交,以便技术人员能在接近真实威胁的环境中识别潜在的滥用途径,如生成恶意代码或协助复杂的攻击链。

这种测试方法反映了监管思维的变化,即从“验证合规性”转向“压力测试极限风险”。

OpenAI和Anthropic此前在白宫推动的“自愿AI安全承诺”框架下,已与美国政府建立了类似的合作机制,其模型也曾被纳入发布前测试和安全评估流程。

该机制并非孤立行动,而是美国近年来逐步推进的AI治理路径的一部分。

CAISI通过与头部模型开发者建立常态化合作,已完成了40多项针对前沿模型的评估,其中包括未公开发布的系统。

这意味着,“模型发布前测试”正逐步演变为类似医药临床试验或航空适航认证的标准流程。

近几周,包括Anthropic Mythos在内的多款先进AI系统相继发布,其大幅增强黑客攻击能力的特性在全球引发热议,也引起了美国政府及本土企业的高度关注,促使监管从被动应对转向主动介入。

值得注意的是,针对前沿AI模型可能带来的风险,行业也开始采取行动。

就在前几天,Anthropic联合亚马逊云科技、苹果、博通、思科、CrowdStrike、谷歌、摩根大通、Linux基金会、微软、英伟达和派拓网络等,共同宣布了一项名为“Project Glasswing”的新倡议。

在AI挖出27年漏洞后,惶恐的硅谷科技巨头们启动了“玻璃翅”项目

据此,各大科技巨头联合起来,利用前沿AI能力为全球最关键软件提供防御。

尽管目前仍以合作为主,尚未形成具有强制力的法律框架,但其政策信号意义显著。

有分析认为,这种模式可能成为未来正式立法的过渡形式,即在不对企业发布决策进行直接干预的情况下,构建一套事实上的行业准入标准。

随着美国在该领域的制度探索不断推进,类似机制也可能被其他主要经济体借鉴,从而推动全球范围内形成更一致的前沿AI监管范式。