人工智能的安全隐患与治理策略
人工智能(artificial intelligence,AI)作为新一轮科技革命的核心技术,正在深刻改变全球经济、社会和环境格局。然而,人工智能技术的飞速发展也伴随着一系列安全问题,如何实现其可持续发展已成为全球关注的焦点。人工智能的可持续发展不仅依赖于技术突破,更需要与人类社会的未来发展相协调。唯有加强人工智能治理,确保其在安全、可靠、可控的环境下运行,才能实现'科技为人服务,智能向善发展'的目标。本文将从人工智能的安全风险入手,深入探讨其可持续发展的路径与方法。
一、现状:AI安全监管趋于宽松
2025年初,杭州深度求索公司发布的DeepSeek-R1大语言模型迅速占领市场,至2月1日,其日活跃用户数已突破3000万。该模型凭借在算法和工程上的创新,成功降低了对算力的依赖和开发成本,在短时间内成为顶尖大模型之一。此外,DeepSeek-R1于1月20日宣布开源,通过开放代码和训练方法,迅速成为全球AI开发者的重要资源,在Hugging Face平台上的下载量超过70万次,衍生模型数量达到670个以上,远超OpenAI等闭源模型。这标志着人工智能进入了一个高性能、低成本、低门槛的新时代。
然而,人工智能快速发展的同时,安全监管却趋于宽松。2025年1月23日,美国总统特朗普签署行政命令,废除了拜登时期旨在规范人工智能发展的相关措施,认为这些规定对人工智能创新造成了过度限制。与此同时,国际上对人工智能安全的关注度也在下降。在第三届巴黎人工智能行动峰会上,尽管主办方宣称要推动包容和可持续的人工智能发展,但会议重点却转向了技术推广,安全议题被边缘化。这些现象都反映出当前人工智能发展的潜在安全危机。
事实上,人工智能发展正面临严峻的安全挑战。著名AI专家杰弗里·辛顿曾警告,缺乏有效约束的人工智能可能对人类构成重大威胁。而目前针对人工智能安全的研究明显不足,只有准确识别人工智能发展过程中可能出现的安全风险,并采取有效应对措施,才能真正实现人工智能的可持续发展。
二、挑战:AI发展面临的核心安全威胁
当前,人工智能发展面临的主要安全威胁可以归纳为AI幻觉风险、滥用风险以及存在性风险。
(一)AI幻觉风险
生成式人工智能在与人类交互过程中,可能会产生看似合理但违背事实的错误信息,即AI幻觉现象。近期,人工智能公司Vectara发布了一份关于大模型表现的报告,评估了104个模型的应答率和幻觉率等指标。结果显示,虽然大模型的应答率接近100%,但在处理超出知识范围的问题时,许多模型会编造不实信息,导致幻觉产生。其中,Gemini-2.0-Flash的幻觉率最低,仅为0.7%,而DeepSeek-R1的幻觉率达到了14.3%,甚至有个别模型的幻觉率接近30%。
尽管AI幻觉并非由模型主观意愿产生,但这种现象已经对人类社会造成了实际危害。最典型的例子是,2025年初出现的一则声称'截至2024年末,‘80后’死亡率突破5.2%,相当于每20个‘80后’中就有1人去世'的新闻在网上传播。尽管中国人民大学人口与健康学院的李婷教授指出这一数据与实际情况严重不符,但许多不负责任的报道仍然引用此说法,误导公众认知。