FDA拟推AI临床试验试点,关键考量有哪些?
食品药品监督管理局(FDA,亦称“该机构”)发出此公告,旨在针对一项拟议的试点计划征集建议,该计划将探讨人工智能(AI)赋能技术如何优化早期临床试验在效率、速度及决策质量上的表现。早期临床试验往往是药物研发中的主要瓶颈,通常具有高度不确定性、受试者规模受限以及决策流程低效等特征。本试点旨在研究如何借助AI和数据科学的最新进展来提升试验效率、加强安全性监控、辅助剂量选择,并在确保FDA严谨的科学监管标准及推动可信AI系统发展的前提下,使早期的“继续/终止”决策(如对I期研究是否推进的监管裁定)更加科学依据充分。该试点将以与美国家标准与技术研究院(NIST)AI风险管理框架(AI RMF)一致的原则为指导。
日期(DATES):书面或电子形式的反馈需在2026年5月29日前提交。
I. 背景
此公告为利益相关方及公众提供了表达观点的平台,以评估AI赋能技术如何优化早期临床试验在效率、速度及决策质量上的表现。
A. 面临的挑战
早期试验通常面临:
剂量、安全性及有效性方面的不确定性。
受试者群体规模受限。
试验推进决策过程低效。
周期漫长且资源消耗巨大。
B. 人工智能的潜力[1]
AI 能够:
优化受试者招募工作。
提升剂量爬坡(dose escalation)的效率。
强化安全性监测机制。
辅助自适应设计。
促进从I期向II期更早推进的决策。
提升生物标志物评估水平。
优化基于生物标志物的受试者筛选与分层。
完善终点验证。
C. 可信的 AI
FDA 支持外部申办方/研究者在遵循NIST AI RMF[2]原则的前提下应用AI,这些原则涵盖:有效、安全、可靠、可问责、可解释、隐私保护及公平。
FDA 将参考此前在草案指南中提出的关于利用AI支持监管决策的考量因素[3]。
D. 产业对齐
行业实践涵盖AI治理、保障(assurance)及风险管理框架。FDA 致力于与这些实践保持一致,推动行业在临床试验中采纳AI技术。
E. 试点项目
试点计划招募目前正在向药物评估与研究中心(CDER)、生物制品评估与研究中心(CBER)及肿瘤卓越中心(OCE)提交产品申请、并开展早期临床试验的申办方。
该试点将由专员办公室副首席医疗官统筹管理。
II. 试点设计扩展性考量
FDA 就以下问题征集意见。为便于高效审阅,请按类别和编号标注您回复的问题。若回复多个问题,请逐一标注编号并分类作答。
A. 试点项目的设计与实施
FDA 就如何构建试点以最大化学习效果、可行性与影响力征求意见:
a. 哪些试验类型或问题最可能从AI应用中受益(例如:首次人体试验、肿瘤剂量爬坡、罕见病试验)?
b. 试点应聚焦特定治疗领域,还是保持广泛适用?
c. 是否应优先某些AI用例(例如:招募、安全监测)?若是,具体是哪些?
a. FDA应采用哪些标准来筛选申办方、试验或技术?
b. 试点如何确保在组织规模、能力和治疗领域上的代表性?
a. 什么样的合作伙伴关系(例如:申办方—技术供应商—学术机构—FDA)最为有效?
b. FDA如何促成竞合前(pre-competitive)的协作与知识共享?
c. 患者团体与研究者在AI治理中应扮演何种角色?
a. FDA应提供哪些支持(例如:监管互动、技术指南)?
b. 需要何种基础设施(例如:安全数据环境、共享工具)?
c. 试点如何适配参与方不同的AI成熟度水平?
a. 试点的合适周期是多久?
b. 应设置哪些中期里程碑或检查点(例如:入组进展、安全性审查、中期分析)?
c. FDA应如何在快速获取洞察与严格评估之间取得平衡?
a. 应如何记录并传播经验教训?
b. 在保护专有信息的同时,采用何种机制促进透明度?
B. 评估指标与成功标准
FDA 就试点评估的适当指标与方法征求意见,包括:
a. 应如何衡量试验效率的改进(例如:启动、入组或完成所需时间)?
b. 应采用哪些指标评估从I期完成到II期启动的时间缩短?
c. 应如何量化受试者筛选、招募效率与受试者留存的提升?
a. 应如何评估继续/终止(go/no-go)决策的质量与及时性(包括FDA监管决定与申办方内部决策点)?
b. 采用何种方法评估AI支持的决策与传统决策之间的一致性?
c. 应如何衡量由于早期阶段决策改进而导致的后期试验失败率下降?
a. 应采用哪些指标评估安全信号的发现与响应时间?
b. 应如何评估AI对不良事件发生率或方案偏离的影响?
c. 采用哪些措施评估数据完整性(完整性、准确性、一致性)的改进?
a. 评估AI模型准确性、稳健性与泛化能力的最佳指标为何?
b. 应如何测量AI系统随时间的稳定性,包括模型漂移的检测与缓解?
c. 如何在不同人群、试验中心与治疗领域间评估其表现?
a. 应提供何种证据以证明AI系统在临床试验情境中的有效性与可靠性?
b. 应如何评估与AI系统相关的安全与风险缓解?
c. 针对不同利益相关方,哪些指标可用于评估透明度与可解释性?是否存在既适用于申办方自研系统又适用于专有系统的通用指标?
d. 应如何评估隐私保护与数据治理实践?
e. 应采用何种方法评估跨人口统计学与临床亚组的公平性?
a. 最合适的对照为何(例如:历史对照、同期非AI试验、模拟研究)?
b. 在比较中应如何处理试验设计、复杂性或治疗领域差异?
a. 应如何评估利益相关方对AI赋能试验方法的信任度(例如:研究者、受试者、监管机构)?
b. 采用何种方法评估可用性与在临床工作流程中的整合?
c. 应如何衡量感知价值、可扩展性与运营可行性?
Grace R. Graham
政策、立法与国际事务副局长
脚注
15 U.S.C. 9401(3)(亦见 FDA《用于支持药品和生物制品监管决策的人工智能使用考量》草案指南): “人工智能”一词指一种基于机器的系统,该系统可针对一组人类定义的目标,做出影响真实或虚拟环境的预测、建议或决策。人工智能系统使用机器和人类输入以:
(A)感知真实与虚拟环境;
(B)通过自动化分析将上述感知抽象为模型;以及
(C)使用模型推理形成信息或行动方案。
[2]
NIST AI 风险管理框架(AI RMF)可在以下网址获取:https://www.nist.gov/itl/ai-risk-management-framework。
[3]
《用于支持药品和生物制品监管决策的人工智能使用考量》可在以下网址获取:https://www.fda.gov/regulatory-information/search-fda-guidance-documents/considerations-use-artificial-intelligence-support-regulatory-decision-making-drug-and-biological。