标签

FDA拟推AI临床试验试点,关键考量有哪些?

发布时间:2026-05-18 00:21来源:微信阅读:6

食品药品监督管理局(FDA,亦称“该机构”)发出此公告,旨在针对一项拟议的试点计划征集建议,该计划将探讨人工智能(AI)赋能技术如何优化早期临床试验在效率、速度及决策质量上的表现。早期临床试验往往是药物研发中的主要瓶颈,通常具有高度不确定性、受试者规模受限以及决策流程低效等特征。本试点旨在研究如何借助AI和数据科学的最新进展来提升试验效率、加强安全性监控、辅助剂量选择,并在确保FDA严谨的科学监管标准及推动可信AI系统发展的前提下,使早期的“继续/终止”决策(如对I期研究是否推进的监管裁定)更加科学依据充分。该试点将以与美国家标准与技术研究院(NIST)AI风险管理框架(AI RMF)一致的原则为指导。

日期(DATES):书面或电子形式的反馈需在2026年5月29日前提交。

I. 背景

此公告为利益相关方及公众提供了表达观点的平台,以评估AI赋能技术如何优化早期临床试验在效率、速度及决策质量上的表现。

A. 面临的挑战

早期试验通常面临:

剂量、安全性及有效性方面的不确定性。

受试者群体规模受限。

试验推进决策过程低效。

周期漫长且资源消耗巨大。

B. 人工智能的潜力[1]

AI 能够:

优化受试者招募工作。

提升剂量爬坡(dose escalation)的效率。

强化安全性监测机制。

辅助自适应设计。

促进从I期向II期更早推进的决策。

提升生物标志物评估水平。

优化基于生物标志物的受试者筛选与分层。

完善终点验证。

C. 可信的 AI

FDA 支持外部申办方/研究者在遵循NIST AI RMF[2]原则的前提下应用AI,这些原则涵盖:有效、安全、可靠、可问责、可解释、隐私保护及公平。

FDA 将参考此前在草案指南中提出的关于利用AI支持监管决策的考量因素[3]。

D. 产业对齐

行业实践涵盖AI治理、保障(assurance)及风险管理框架。FDA 致力于与这些实践保持一致,推动行业在临床试验中采纳AI技术。

E. 试点项目

试点计划招募目前正在向药物评估与研究中心(CDER)、生物制品评估与研究中心(CBER)及肿瘤卓越中心(OCE)提交产品申请、并开展早期临床试验的申办方。

该试点将由专员办公室副首席医疗官统筹管理。

II. 试点设计扩展性考量

FDA 就以下问题征集意见。为便于高效审阅,请按类别和编号标注您回复的问题。若回复多个问题,请逐一标注编号并分类作答。

A. 试点项目的设计与实施

FDA 就如何构建试点以最大化学习效果、可行性与影响力征求意见:

a. 哪些试验类型或问题最可能从AI应用中受益(例如:首次人体试验、肿瘤剂量爬坡、罕见病试验)?

b. 试点应聚焦特定治疗领域,还是保持广泛适用?

c. 是否应优先某些AI用例(例如:招募、安全监测)?若是,具体是哪些?

a. FDA应采用哪些标准来筛选申办方、试验或技术?

b. 试点如何确保在组织规模、能力和治疗领域上的代表性?

a. 什么样的合作伙伴关系(例如:申办方—技术供应商—学术机构—FDA)最为有效?

b. FDA如何促成竞合前(pre-competitive)的协作与知识共享?

c. 患者团体与研究者在AI治理中应扮演何种角色?

a. FDA应提供哪些支持(例如:监管互动、技术指南)?

b. 需要何种基础设施(例如:安全数据环境、共享工具)?

c. 试点如何适配参与方不同的AI成熟度水平?

a. 试点的合适周期是多久?

b. 应设置哪些中期里程碑或检查点(例如:入组进展、安全性审查、中期分析)?

c. FDA应如何在快速获取洞察与严格评估之间取得平衡?

a. 应如何记录并传播经验教训?

b. 在保护专有信息的同时,采用何种机制促进透明度?

B. 评估指标与成功标准

FDA 就试点评估的适当指标与方法征求意见,包括:

a. 应如何衡量试验效率的改进(例如:启动、入组或完成所需时间)?

b. 应采用哪些指标评估从I期完成到II期启动的时间缩短?

c. 应如何量化受试者筛选、招募效率与受试者留存的提升?

a. 应如何评估继续/终止(go/no-go)决策的质量与及时性(包括FDA监管决定与申办方内部决策点)?

b. 采用何种方法评估AI支持的决策与传统决策之间的一致性?

c. 应如何衡量由于早期阶段决策改进而导致的后期试验失败率下降?

a. 应采用哪些指标评估安全信号的发现与响应时间?

b. 应如何评估AI对不良事件发生率或方案偏离的影响?

c. 采用哪些措施评估数据完整性(完整性、准确性、一致性)的改进?

a. 评估AI模型准确性、稳健性与泛化能力的最佳指标为何?

b. 应如何测量AI系统随时间的稳定性,包括模型漂移的检测与缓解?

c. 如何在不同人群、试验中心与治疗领域间评估其表现?

a. 应提供何种证据以证明AI系统在临床试验情境中的有效性与可靠性?

b. 应如何评估与AI系统相关的安全与风险缓解?

c. 针对不同利益相关方,哪些指标可用于评估透明度与可解释性?是否存在既适用于申办方自研系统又适用于专有系统的通用指标?

d. 应如何评估隐私保护与数据治理实践?

e. 应采用何种方法评估跨人口统计学与临床亚组的公平性?

a. 最合适的对照为何(例如:历史对照、同期非AI试验、模拟研究)?

b. 在比较中应如何处理试验设计、复杂性或治疗领域差异?

a. 应如何评估利益相关方对AI赋能试验方法的信任度(例如:研究者、受试者、监管机构)?

b. 采用何种方法评估可用性与在临床工作流程中的整合?

c. 应如何衡量感知价值、可扩展性与运营可行性?

Grace R. Graham

政策、立法与国际事务副局长

脚注

15 U.S.C. 9401(3)(亦见 FDA《用于支持药品和生物制品监管决策的人工智能使用考量》草案指南): “人工智能”一词指一种基于机器的系统,该系统可针对一组人类定义的目标,做出影响真实或虚拟环境的预测、建议或决策。人工智能系统使用机器和人类输入以:

(A)感知真实与虚拟环境;

(B)通过自动化分析将上述感知抽象为模型;以及

(C)使用模型推理形成信息或行动方案。

[2]

NIST AI 风险管理框架(AI RMF)可在以下网址获取:https://www.nist.gov/itl/ai-risk-management-framework。

[3]

《用于支持药品和生物制品监管决策的人工智能使用考量》可在以下网址获取:https://www.fda.gov/regulatory-information/search-fda-guidance-documents/considerations-use-artificial-intelligence-support-regulatory-decision-making-drug-and-biological。