人工智能安全:重塑信任未来的关键路径
导语:近期,美国外交关系协会(CFR)发布《保障智能安全:人工智能安全何以定义信任的未来》报告,强调AI安全是各国巩固技术领导力的核心,剖析了模型漏洞、治理缺失及攻防失衡风险,主张以信任驱动AI可持续应用。
一、脆弱的基石:守护AI供应链安全
支撑AI的代码与模型架构存在隐患。数据显示,近45%的AI生成代码潜藏缺陷,将企业收益转化为法律风险。公共库中泄露密钥超2.5万个,同比增长64%,27%仍具活性。仅需250份恶意文档,便能在大模型中植入后门。这动摇了模型完整性信心,数据溯源受损威胁国家安全。
这些底层漏洞会波及整个AI生态系统,侵蚀支撑国家与企业决策基础设施的信心。在金融领域,模型风险管理增加了部署难度,尤其在溯源和可解释性方面。2025年,医疗机构受HIPAA更严标准制约,对AI部署更审慎,导致前沿技术多局限于边缘业务。解决供应链问题需建立可验证溯源、安全流程及持续审计,并将其纳入国家AI框架和国际最佳实践。
二、信任赤字:自主智能体的潜在风险
AI的终极目标是实现跨系统协调的自主智能体,但信任缺失是最大障碍。2025年8月Salesloft-Drift的AI漏洞暴露了安全令牌,导致700余家企业的数据外泄,同时也揭示了数字基础设施互联带来的连锁风险。
诸多失败案例印证了这种担忧。攻击者将恶意指令嵌入网页或文档,诱导AI系统执行的“间接提示注入”仍是顽疾。2025年10月,OpenAI推出的ChatGPT Atlas浏览器产品上线即暴露出对此类攻击的系统性脆弱性,尽管经过大量红队测试,提示注入仍未彻底解决。
三、治理缺位:“影子人工智能”与机构风险
企业中不受监管的工具被称为“影子人工智能”,这是负责任使用AI的主要阻碍。研究发现,13%的组织遭遇过AI相关泄露,平均成本比传统泄露高出67万美元。因88%的组织缺乏成熟的内部威胁预测模型,导致合规性和风险管理难以证明,无法为试点外部署提供依据。
其战略影响远超成本。在模拟环境中,当AI目标与组织宗旨冲突时,系统会表现出有害行为,如勒索和间谍活动,即“智能体错位”。这直指AI应用核心:若系统在优化狭隘目标时违反广泛约束,企业就无法安全授权。影子AI的泛滥反映了治理失败,缺乏标准化机制追踪、审计认证,导致技术发展速度超越了问责机制。
四、节奏困境:攻防速度的失衡
AI驱动的网络攻击节奏加快,导致攻防失衡,削弱了国家防御数字基础设施的信心。一半的关键基础设施组织在过去一年遭受AI攻击,漏洞利用时间从数天缩至数分钟。XBOW平台已能以75%成功率在几分钟内完成人类数小时的工作。这种演进并非渐进式,而是变革性的,已超越传统安全响应能力。
企业正开发AI增强防御系统,超80%的大型公司利用AI加强网络安全。部署AI的组织比未部署的检测速度快98天,平均泄露成本降低200万美元。然而,许多组织仍限制AI的自主性和权限,不愿完全整合,担心被反噬。机器速度的漏洞利用与智能规避结合,使安全团队处于劣势。若对手进攻自动化速度超过防御自动化速度,将主导数字冲突规则。对于CISO而言,面临残酷抉择:要么部署对手入侵更快的人工智能系统,要么推迟部署。
五、可信度危机:AI欺诈与数字真实性
AI驱动的欺诈正威胁着AI应用所必需的社会基础。用于模仿个人的合成图像、视频或声音的深度伪造技术,到2024年底已占所有检测到欺诈事件的7%。2025年上半年,深度伪造欺诈造成的损失达到4.1亿美元,已超过2024年全年的总额。此类事件侵蚀了人们对语音认证、视频会议及身份验证机制的信心。
引发可信度危机的技术已实现规模化成熟应用。实时AI语音克隆现在已能在安全评估过程中成功实施攻击,通过近乎完美地模仿可信人员,实现密码重置和账户接管。目前的检测系统和人类判断都无法可靠地区分真实身份与合成身份。
这种信任侵蚀不仅限于企业风险,还延伸至基础设施。当公民无法信任视频、音频或文本的真实性时,他们不仅会对恶意深度伪造内容持全面怀疑态度,也会对远程医疗、在线教育和数字治理等领域的合法AI应用产生质疑。若不加以解决,AI生成的虚假信息的蔓延不仅会侵蚀企业信任,还会损害公民社会的合法性,使信息完整性成为战略竞争的核心维度。
六、筑牢根基:构建可信的AI未来
AI所承诺的变革现在取决于能否解决制约其应用的安全挑战。创新与安全并非对立目标,没有强有力的保障措施,创新所产生的系统将过于脆弱而难以持续。据估计,一次数据泄露的平均成本为440万美元,而AI驱动的泄露成本可能更高。
一些行业高管认为,更严格的保障标准将阻碍本国AI创新,并让约束较少的竞争对手国家获得优势。这种观点误解了当前的挑战。安全要求可能会延缓不成熟的部署,但通过培养广泛整合所需的信任,它们将加速负责任的应用推广。真正的竞争不在于谁部署得最快,而在于谁能安全、可靠且可持续地实现AI规模化应用。
前进的道路需要将AI安全视为可信且可持续的AI应用的基础。首先,政府和企业应将所有AI生成的代码视为不可信输入,必须进行强制审查。其次,应采用专为AI系统设计的零信任架构,包括沙盒智能体、最小权限访问和实时异常监控等等。再次,应实施治理框架,通过集中审批流程和审计跟踪消除影子AI。最后,国家安全和关键基础设施运营者应实施持续的模型完整性监控,开展AI事件响应演练,预设漏洞发生的可能性并设计快速遏制方案。
目前不确定的是,政府能否及时采取行动,塑造而非被动遵循新兴的技术竞争规则。保障AI安全不仅仅是一项技术保障措施,更是民主韧性的战略要求。各国在数字秩序中的领导力可信度,将取决于它们能否将信任嵌入机器智能的架构本身。
参考