人工智能安全：重塑信任未来的关键路径

发布时间：2026-06-05 18:55阅读：26

导语：近期，美国外交关系协会（CFR）发布《保障智能安全：人工智能安全何以定义信任的未来》报告，强调AI安全是各国巩固技术领导力的核心，剖析了模型漏洞、治理缺失及攻防失衡风险，主张以信任驱动AI可持续应用。

一、脆弱的基石：守护AI供应链安全

支撑AI的代码与模型架构存在隐患。数据显示，近45%的AI生成代码潜藏缺陷，将企业收益转化为法律风险。公共库中泄露密钥超2.5万个，同比增长64%，27%仍具活性。仅需250份恶意文档，便能在大模型中植入后门。这动摇了模型完整性信心，数据溯源受损威胁国家安全。

这些底层漏洞会波及整个AI生态系统，侵蚀支撑国家与企业决策基础设施的信心。在金融领域，模型风险管理增加了部署难度，尤其在溯源和可解释性方面。2025年，医疗机构受HIPAA更严标准制约，对AI部署更审慎，导致前沿技术多局限于边缘业务。解决供应链问题需建立可验证溯源、安全流程及持续审计，并将其纳入国家AI框架和国际最佳实践。

二、信任赤字：自主智能体的潜在风险

AI的终极目标是实现跨系统协调的自主智能体，但信任缺失是最大障碍。2025年8月Salesloft-Drift的AI漏洞暴露了安全令牌，导致700余家企业的数据外泄，同时也揭示了数字基础设施互联带来的连锁风险。

诸多失败案例印证了这种担忧。攻击者将恶意指令嵌入网页或文档，诱导AI系统执行的“间接提示注入”仍是顽疾。2025年10月，OpenAI推出的ChatGPT Atlas浏览器产品上线即暴露出对此类攻击的系统性脆弱性，尽管经过大量红队测试，提示注入仍未彻底解决。

三、治理缺位：“影子人工智能”与机构风险

企业中不受监管的工具被称为“影子人工智能”，这是负责任使用AI的主要阻碍。研究发现，13%的组织遭遇过AI相关泄露，平均成本比传统泄露高出67万美元。因88%的组织缺乏成熟的内部威胁预测模型，导致合规性和风险管理难以证明，无法为试点外部署提供依据。

其战略影响远超成本。在模拟环境中，当AI目标与组织宗旨冲突时，系统会表现出有害行为，如勒索和间谍活动，即“智能体错位”。这直指AI应用核心：若系统在优化狭隘目标时违反广泛约束，企业就无法安全授权。影子AI的泛滥反映了治理失败，缺乏标准化机制追踪、审计认证，导致技术发展速度超越了问责机制。

四、节奏困境：攻防速度的失衡

AI驱动的网络攻击节奏加快，导致攻防失衡，削弱了国家防御数字基础设施的信心。一半的关键基础设施组织在过去一年遭受AI攻击，漏洞利用时间从数天缩至数分钟。XBOW平台已能以75%成功率在几分钟内完成人类数小时的工作。这种演进并非渐进式，而是变革性的，已超越传统安全响应能力。

企业正开发AI增强防御系统，超80%的大型公司利用AI加强网络安全。部署AI的组织比未部署的检测速度快98天，平均泄露成本降低200万美元。然而，许多组织仍限制AI的自主性和权限，不愿完全整合，担心被反噬。机器速度的漏洞利用与智能规避结合，使安全团队处于劣势。若对手进攻自动化速度超过防御自动化速度，将主导数字冲突规则。对于CISO而言，面临残酷抉择：要么部署对手入侵更快的人工智能系统，要么推迟部署。

五、可信度危机：AI欺诈与数字真实性

AI驱动的欺诈正威胁着AI应用所必需的社会基础。用于模仿个人的合成图像、视频或声音的深度伪造技术，到2024年底已占所有检测到欺诈事件的7%。2025年上半年，深度伪造欺诈造成的损失达到4.1亿美元，已超过2024年全年的总额。此类事件侵蚀了人们对语音认证、视频会议及身份验证机制的信心。

引发可信度危机的技术已实现规模化成熟应用。实时AI语音克隆现在已能在安全评估过程中成功实施攻击，通过近乎完美地模仿可信人员，实现密码重置和账户接管。目前的检测系统和人类判断都无法可靠地区分真实身份与合成身份。

这种信任侵蚀不仅限于企业风险，还延伸至基础设施。当公民无法信任视频、音频或文本的真实性时，他们不仅会对恶意深度伪造内容持全面怀疑态度，也会对远程医疗、在线教育和数字治理等领域的合法AI应用产生质疑。若不加以解决，AI生成的虚假信息的蔓延不仅会侵蚀企业信任，还会损害公民社会的合法性，使信息完整性成为战略竞争的核心维度。

六、筑牢根基：构建可信的AI未来

AI所承诺的变革现在取决于能否解决制约其应用的安全挑战。创新与安全并非对立目标，没有强有力的保障措施，创新所产生的系统将过于脆弱而难以持续。据估计，一次数据泄露的平均成本为440万美元，而AI驱动的泄露成本可能更高。

一些行业高管认为，更严格的保障标准将阻碍本国AI创新，并让约束较少的竞争对手国家获得优势。这种观点误解了当前的挑战。安全要求可能会延缓不成熟的部署，但通过培养广泛整合所需的信任，它们将加速负责任的应用推广。真正的竞争不在于谁部署得最快，而在于谁能安全、可靠且可持续地实现AI规模化应用。

前进的道路需要将AI安全视为可信且可持续的AI应用的基础。首先，政府和企业应将所有AI生成的代码视为不可信输入，必须进行强制审查。其次，应采用专为AI系统设计的零信任架构，包括沙盒智能体、最小权限访问和实时异常监控等等。再次，应实施治理框架，通过集中审批流程和审计跟踪消除影子AI。最后，国家安全和关键基础设施运营者应实施持续的模型完整性监控，开展AI事件响应演练，预设漏洞发生的可能性并设计快速遏制方案。

目前不确定的是，政府能否及时采取行动，塑造而非被动遵循新兴的技术竞争规则。保障AI安全不仅仅是一项技术保障措施，更是民主韧性的战略要求。各国在数字秩序中的领导力可信度，将取决于它们能否将信任嵌入机器智能的架构本身。

参考

← 上一篇：AI时代手机进化论：与先锋用户共探终端新可能下一篇：AI国学沉浸式智能空间建设方案 →