标签

美国联邦政府推进生成式人工智能应用的管理实践

发布时间:2026-06-01 18:54来源:微信阅读:6

在审计署审查的11个拥有人工智能清单的指定机构中,报告的人工智能应用项目总数从2023年的571个几乎翻倍增至2024年的1,110个。同期,生成式人工智能应用项目增长了约九倍,从32个增至282个。

生成式人工智能具有潜在价值。在任务支持领域,该技术能够改善文字沟通、提升信息获取效率以及追踪项目进展。具体项目示例包括:

退伍军人事务部启动了一项计划,旨在自动化各类医学影像流程,以提升对退伍军人的诊断服务。

为支持脊髓灰质炎病毒的防控,卫生与公众服务部启动了一项计划,从文献资料中提取信息并识别先前被认为无脊髓灰质炎地区的疫情暴发。

机构官员向审计署反映,他们在应用生成式人工智能方面面临若干障碍,包括:遵循现有联邦政策和指导、具备充足的技术资源和预算,以及保持最新的合理使用政策。例如,12个指定机构中有10个的官员表示,现有联邦政策(如数据隐私政策)可能成为应用障碍。此外,四个机构的官员表示,该技术的快速演进可能使生成式人工智能政策和实践的制定变得复杂。

各机构正开始采取措施应对障碍,包括:(1)利用现有人工智能框架和指导来制定自身政策;(2)与其他机构开展协作。在此期间,行政部门的AI指导在2025年初进行了重大修订。因此,各机构在应对障碍的同时,正将这些修订纳入其生成式人工智能管理中。

审计署开展此项研究的原因

近期人工智能能力的增长引发了相应的公众关注。生成式人工智能的发展——能够根据用户提示创建文本、图像、音频、视频和其他内容——彻底改变了该技术在许多行业中的应用方式。然而,生成式人工智能也存在传播错误信息以及带来国家安全和环境风险等隐患。

审计署受邀描述联邦机构在推进生成式人工智能方面的努力。本报告是生成式人工智能系列工作中的第四份。审计署的目标包括:描述指定机构正在使用和计划使用的生成式人工智能及其潜在价值,以及描述各机构在使用和管理生成式人工智能方面面临的障碍及应对努力。

审计署选择了12个在2023年或2024年公开报告拥有生成式人工智能应用项目的机构。审计署审查了11个机构提交的人工智能应用项目清单(国防部免于此项要求)。审计署还分析了12个机构报告的障碍,并对最常被提及的障碍进行了分类。此外,审计署采访了管理与预算办公室和科学技术政策办公室的官员,了解其关于生成式人工智能的全政府政策和指导。

人工智能的兴起引发了日益增长的关注和大量关于其彻底改变整个行业潜力的讨论,尤其是生成式人工智能的最新发展。这些发展催生了能够根据用户提示创建文本、图像、音频、视频和其他内容的应用。尽管近期估算差异很大,但生成式人工智能在未来十年可能为全球经济增加数万亿美元。在短期内,生成式人工智能可能提高生产率并改变许多行业的日常任务。然而,它也可能帮助传播错误信息并带来国家安全和环境风险。随着联邦机构部署生成式人工智能以帮助改善运营和服务交付,管理与预算办公室已指示各机构通过优先考虑创新、治理和公众信任来加速联邦人工智能技术的应用。

生成式人工智能系统使用算法创建输出,这些算法通常在从互联网获取的文本和图像上进行训练。自2017年以来底层系统和架构的技术进步,加上2022年底人工智能工具向公众开放,已导致广泛使用。该技术在不断演进,快速涌现的能力可能彻底改变整个行业。生成式人工智能可以在信息摘要、实现自动化和提高生产率方面为机构带来价值。

然而,尽管能力持续增长,生成式人工智能系统不具备认知能力,缺乏人类判断力,并可能带来众多风险。2024年7月,国家标准与技术研究院发布了一份文件,定义了生成式人工智能特有或被其加剧的风险。例如,国家标准与技术研究院指出,由于未经授权使用、披露或去匿名化生物特征、健康或其他个人身份信息或敏感数据,生成式人工智能可能导致数据隐私风险。

用户可以通过使用称为"提示"的输入——用户输入的问题或描述——来从生成式人工智能系统获取输出,以生成和完善结果。许多可用的生成式人工智能系统允许用户用自然语言或普通语言提示系统,例如在聊天框中键入文本查询。创建或生成新颖内容的能力将生成式人工智能与其他类型的人工智能区分开来。

联邦机构实施人工智能的努力受联邦法律、行政行动和联邦指导的指导。自2019年以来,已颁布了各种法律,并发布了行政命令和指导,以协助联邦机构实施人工智能。例如:

2019年2月,总统发布了13859号行政命令,建立了美国人工智能倡议,促进了人工智能研发投资和协调等。

2020年12月,总统发布了13960号行政命令,促进可信人工智能的使用,侧重于运营人工智能,并为联邦政府中人工智能的设计、开发、获取和使用建立了一套共同原则。

2023年10月,总统发布了14110号行政命令,旨在推进协调一致的、全联邦政府范围的人工智能开发及安全负责任使用方法。

2024年3月,管理与预算办公室发布了M-24-10,旨在推进机构的人工智能治理、创新和风险管理。此外,2024年9月,管理与预算办公室发布了M-24-18,旨在推进政府负责任地获取人工智能。

2025年1月,14148号行政命令发布并废除了14110号行政命令。2025年1月稍后,总统发布了14179号行政命令,更新了美国人工智能政策,并指示在2025年7月22日前提交人工智能行动计划。

2025年4月,根据14179号行政命令的指示,管理与预算办公室发布了M-25-21,废除并取代了M-24-10。该备忘录要求各机构制定生成式人工智能可接受使用政策等人工智能要求。此外,管理与预算办公室发布了M-25-22,废除并取代了M-24-18。该备忘录为各机构提供指导,以提高其负责任地获取人工智能的能力。

除了行政命令和管理与预算办公室政策备忘录外,指定机构还发布了人工智能全政府指导,特别是针对生成式人工智能的指导。

总务管理局政府人工智能指南。该指南旨在通过在定义人工智能、理解其能力和局限性以及解释机构如何将其应用于其任务领域方面提供清晰度和指导,来帮助政府决策者。例如,该指南确定了关键人工智能术语以及各机构可以采取的发展人工智能劳动力的步骤。

国家标准与技术研究院生成式人工智能和双用途基础模型安全软件开发实践。该文件通过纳入生成式人工智能和其他先进通用目的模型的实践,扩展了国家标准与技术研究院的安全软件开发框架。它记录了潜在的生成式人工智能开发风险因素及应对策略。

2021年10月,联邦首席信息官委员会发布了《2021年创建机构人工智能应用项目清单指南》。该指南为各机构提供了符合13960号行政命令的结构化方法来识别和报告其人工智能应用项目。2023年,联邦首席信息官委员会通过发布《根据13960号行政命令创建机构人工智能应用项目清单指南》更新了该指南。它为各机构提供了创建和公开其年度人工智能应用项目清单的标准、格式和机制。

最近,2024年8月,联邦首席信息官委员会发布了《根据14110号行政命令的2024年机构人工智能报告指南及后续补充信息》。该指南和信息为各机构提供了关于2024年人工智能应用项目报告的标准、格式和机制的详细说明。补充信息还定义了以下开发阶段,以指导各机构识别每个应用项目的开发状态:

已启动。已表达对人工智能应用项目的需求,并记录了其预期目的和高级别要求。

获取或开发中。已确定一个人工智能应用项目进行开发或正在开发中,具备必要的信息技术工具和数据基础设施可供使用。

实施与评估中。与该应用项目相关的人工智能系统当前正在进行功能和安全测试。

运行与维护中。人工智能应用项目已整合到机构运营中,并正在监测其性能。

已退役。人工智能应用项目已退役或正在退役过程中。

该2024年指南还要求各机构在其清单中提供每个应用项目的主题领域。联邦首席信息官委员会为11个应用项目主题领域中的每一个提供了示例。

2025年4月,管理与预算办公室发布了M-25-21(取代了M-24-10),指示各机构继续至少每年清点其人工智能应用项目,向管理与预算办公室提交清单,并在其网站上发布公开版本。它还鼓励各机构持续更新其清单的公开版本,以反映其当前人工智能使用情况。此外,M-25-21要求各机构:

识别高影响人工智能应用项目。各机构必须确定一个人工智能应用项目是否因其对隐私或获取某些福利和服务的潜在影响等而符合"高影响"标准。首席人工智能官负责集中跟踪高影响应用项目及相关判定。

记录风险管理行动。各机构必须在部署任何高影响人工智能应用项目之前完成人工智能影响评估,并实施备忘录中概述的最低风险管理实践。首席人工智能官可根据书面的、系统特定的和情境特定的风险评估豁免特定要求,并且必须集中跟踪豁免。

公开披露并通知管理与预算办公室豁免和判定。各机构必须根据适用法律和全政府政策,公开发布描述每个与高影响人工智能应用项目相关的个别判定和豁免的摘要。首席人工智能官必须在授予或撤销豁免后30天内向管理与预算办公室报告每个豁免的范围、理由和支持证据。

我们对报告的2024年人工智能应用项目清单的分析显示,指定机构正在使用或计划使用生成式人工智能技术,这些技术提供了一系列预期价值。略多于一半的这些应用项目(61%)被归入称为任务赋能功能的主题领域。该主题领域涵盖任务支持活动,如提高书面沟通质量、增强信息获取效率、总结报告和追踪项目状态。生成式人工智能应用项目数量排名第二和第三的主题领域分别是政府服务(15%)和健康与医疗(9%)。这三个主题领域占我们指定机构2024年报告的282个生成式人工智能应用项目的84%。

此外,指定机构在2024年报告称,其282个生成式人工智能应用项目涵盖了不同的开发阶段,其中处于已启动阶段的应用项目数量最多。具体而言,84个应用项目(30%)处于初始开发阶段,即已表达需求并记录了预期目的和要求。另外75个应用项目(27%)处于获取或开发阶段。剩余的123个应用项目处于实施与评估阶段、运行与维护阶段或已退役。

任务支持功能。各机构主要正在使用或计划使用生成式人工智能来支持内部机构运营,如简化流程和改善沟通。例如,各机构已使用生成式人工智能来提高书面沟通质量,促进更清晰、更有效的信息获取。此外,已部署了生成式人工智能驱动的工具用于信息搜索,使人员能够更高效地检索相关数据。此外,报告摘要是各机构报告生成式人工智能可以通过将大量文档浓缩为简洁摘要来促进运营效率的另一个领域,有助于更快理解和决策。报告的任务支持生成式人工智能应用项目的具体示例包括:

开发全政府人工智能资源概念。根据总务管理局官员的说法,联邦首席信息官委员会创新委员会正在领导一项涉及总务管理局、能源部、国家科学基金会和商务部国家海洋和大气管理局的倡议,以创建一种全政府方法来识别和共享现有人工智能资源。国家科学基金会官员强调,当社区共享关于产品和能力的信息,将此类能力的开发视为联邦事业时,政府实施人工智能解决方案(如生成式人工智能系统)的整体能力得到加强。

人工智能在野火管理中应用的机构间协作。内政部正在与美国农业部林务局合作,探索生成式人工智能在野火管理中的应用,特别是关于可能影响政府设施的野火。据研究人员称,生成式人工智能可用于对野火应用预测建模。这将能够预测火灾的可能路径、强度和增长速率,从而使消防员和疏散团队能够改善野火响应。

总务管理局联邦人工智能黑客马拉松以增强数字服务。总务管理局与其他联邦实体合作,于2024年7月31日在华盛顿特区、亚特兰大和纽约市举办了联邦人工智能黑客马拉松。该活动聚焦于优化政府网站和数字服务,利用生成式人工智能使其更高效、用户友好并能响应用户需求。参与者使用生成式人工智能工具进行竞赛,编写代码、提出标准并创建增加人工智能响应可靠性的功能。

此外,管理与预算办公室M-25-21规定,到2025年7月,管理与预算办公室将召集并主持一个机构间委员会,通过协调各机构项目和运营中人工智能的开发和使用来最大化机构效率,如推广共享模板、技术资源和人工智能示范用途。

三、选定机构报告了若干生成式人工智能障碍

12个选定机构报告称,它们在使用和管理生成式人工智能方面面临若干障碍。

3.1 遵守现有联邦政策和指导

选定机构在使用生成式人工智能时必须遵守现有和近期发布的联邦政策和指导。然而,12个选定机构中有10个(商务部、国土安全部、国防部、能源部、内政部、总务管理局、国家航空航天局、国家科学基金会、国务院和退役军人事务部)的官员表示,现有联邦人工智能政策可能未考虑到生成式人工智能的采用,或可能构成采用障碍。例如,在网络安全、数据隐私和信息技术采购等相关技术领域,有大量适用的联邦法律、政策和指导要求各机构遵循。鉴于与生成式人工智能相关的风险,遵守这些指导文件可能被证明很困难。退役军人事务部官员还指出,现有隐私政策可能禁止与其他机构共享信息,这可能阻碍在生成式人工智能风险和进展方面的有效协作。此外,四个选定机构(总务管理局、卫生和公众事务部、国家航空航天局和国家科学基金会)的官员告诉我们,该技术的快速演进可能使各机构难以制定灵活的生成式人工智能政策和实践。

3.2 拥有充足的技术资源和预算

生成式人工智能可能需要具有大量计算和技术资源的基础设施。八个选定机构(商务部、国土安全部、国防部、国家科学基金会、总务管理局、国家航空航天局、人事管理办公室和退役军人事务部)报告了在获取或访问所需技术资源方面的障碍。例如,国防部和国家航空航天局官员告诉我们,他们可以使用生成式人工智能进行更多高级研究,但受限于获取执行这些任务所需的高级计算基础设施。此外,七个选定机构(商务部、国防部、内政部、国土安全部、总务管理局、国家科学基金会和退役军人事务部)报告了与获得建立这些资源和支持所需生成式人工智能举措的资金相关的障碍。人事管理办公室官员引用了雇佣新生成式人工智能专家的成本,而商务部官员引用了在生成式人工智能投资与其他信息技术现代化努力之间取得平衡作为促成因素。

3.3 获取生成式人工智能工具

超过一半的选定机构主要是采购生成式人工智能产品和服务而非内部开发。然而,总务管理局、国家航空航天局和退役军人事务部官员报告称,由于获得联邦风险与授权管理计划授权所需的时间,在获取商业生成式人工智能产品和服务(包括基于云的服务)方面遇到了延误。根据我们审查的文献,当提供商不熟悉联邦采购要求时,这些延误可能加剧。

3.4 招聘和发展人工智能劳动力

六个选定机构(商务部、国防部、国家航空航天局、人事管理办公室、国务院和退役军人事务部)报告了在吸引和发展具有生成式人工智能专业知识的人才方面的障碍。这些机构还可能受到与私营部门竞争同样技能专业人才的影响。此外,这些机构还报告了在建立和为其现有劳动力提供持续教育和技术技能发展方面的困难。这些机构引用了各种制约因素,如国家航空航天局官员引用了建立培训项目和在技术快速演进时维护培训内容所需的资源。

3.5 保持最新的适当使用政策

随着选定机构寻求采用生成式人工智能,六个机构(商务部、国土安全部、能源部、总务管理局、国家科学基金会和国务院)报告了在保持生成式人工智能当前和适当使用政策方面的困难。总务管理局官员告诉我们,新的生成式人工智能技术发展可能超过该机构维护该技术适当使用政策的能力。进一步加剧这一挑战的是,能源部官员告诉我们,他们在维护充分定义该技术、其潜在能力及其局限性的适当使用政策方面面临困难。

3.6 解决偏见并确保可靠性

12个选定机构中有五个(国土安全部、国防部、能源部、国家航空航天局和国务院)的官员告诉我们,生成式人工智能可能产生有偏见的输出或幻觉——看似合理但最终错误的输出。国防部和能源部官员进一步表示,生成式人工智能系统面临网络安全威胁,需要开展工作来减轻网络安全漏洞。正如国家标准与技术研究院的人工智能风险管理框架所述,各机构使用的生成式人工智能工具应旨在可靠地产生一致且对不利事件具有弹性的结果。确保可靠性涉及建立针对人工智能系统漏洞(包括网络安全威胁)的保护措施,以防止系统无法按设计运行。

3.7 系统输入和输出缺乏透明度

国防部和国家航空航天局官员告诉我们,一些用户缺乏理解生成式人工智能系统如何产生其结果的专业知识,并表示用户可能对系统输出产生错误的确定感。此外,通常没有关于用于生成结果的算法的文档。例如,国防部官员告诉我们,目前尚不清楚生成式人工智能系统如何得出某些输出,这种缺乏透明度可能降低用户对系统输出的信心。正如国家标准技术研究院的人工智能风险管理框架所述,各机构使用的生成式人工智能工具应优先考虑透明度,不仅在其训练数据方面,而且在其数据