FDA拟推AI临床试验试点，关键考量有哪些？

发布时间：2026-05-18 00:21阅读：18

食品药品监督管理局（FDA，亦称“该机构”）发出此公告，旨在针对一项拟议的试点计划征集建议，该计划将探讨人工智能（AI）赋能技术如何优化早期临床试验在效率、速度及决策质量上的表现。早期临床试验往往是药物研发中的主要瓶颈，通常具有高度不确定性、受试者规模受限以及决策流程低效等特征。本试点旨在研究如何借助AI和数据科学的最新进展来提升试验效率、加强安全性监控、辅助剂量选择，并在确保FDA严谨的科学监管标准及推动可信AI系统发展的前提下，使早期的“继续/终止”决策（如对I期研究是否推进的监管裁定）更加科学依据充分。该试点将以与美国家标准与技术研究院（NIST）AI风险管理框架（AI RMF）一致的原则为指导。

日期（DATES）：书面或电子形式的反馈需在2026年5月29日前提交。

I. 背景

此公告为利益相关方及公众提供了表达观点的平台，以评估AI赋能技术如何优化早期临床试验在效率、速度及决策质量上的表现。

A. 面临的挑战

早期试验通常面临：

剂量、安全性及有效性方面的不确定性。

受试者群体规模受限。

试验推进决策过程低效。

周期漫长且资源消耗巨大。

B. 人工智能的潜力［1］

AI 能够：

优化受试者招募工作。

提升剂量爬坡（dose escalation）的效率。

强化安全性监测机制。

辅助自适应设计。

促进从I期向II期更早推进的决策。

提升生物标志物评估水平。

优化基于生物标志物的受试者筛选与分层。

完善终点验证。

C. 可信的 AI

FDA 支持外部申办方/研究者在遵循NIST AI RMF［2］原则的前提下应用AI，这些原则涵盖：有效、安全、可靠、可问责、可解释、隐私保护及公平。

FDA 将参考此前在草案指南中提出的关于利用AI支持监管决策的考量因素［3］。

D. 产业对齐

行业实践涵盖AI治理、保障（assurance）及风险管理框架。FDA 致力于与这些实践保持一致，推动行业在临床试验中采纳AI技术。

E. 试点项目

试点计划招募目前正在向药物评估与研究中心（CDER）、生物制品评估与研究中心（CBER）及肿瘤卓越中心（OCE）提交产品申请、并开展早期临床试验的申办方。

该试点将由专员办公室副首席医疗官统筹管理。

II. 试点设计扩展性考量

FDA 就以下问题征集意见。为便于高效审阅，请按类别和编号标注您回复的问题。若回复多个问题，请逐一标注编号并分类作答。

A. 试点项目的设计与实施

FDA 就如何构建试点以最大化学习效果、可行性与影响力征求意见：

a. 哪些试验类型或问题最可能从AI应用中受益（例如：首次人体试验、肿瘤剂量爬坡、罕见病试验）？

b. 试点应聚焦特定治疗领域，还是保持广泛适用？

c. 是否应优先某些AI用例（例如：招募、安全监测）？若是，具体是哪些？

a. FDA应采用哪些标准来筛选申办方、试验或技术？

b. 试点如何确保在组织规模、能力和治疗领域上的代表性？

a. 什么样的合作伙伴关系（例如：申办方—技术供应商—学术机构—FDA）最为有效？

b. FDA如何促成竞合前（pre-competitive）的协作与知识共享？

c. 患者团体与研究者在AI治理中应扮演何种角色？

a. FDA应提供哪些支持（例如：监管互动、技术指南）？

b. 需要何种基础设施（例如：安全数据环境、共享工具）？

c. 试点如何适配参与方不同的AI成熟度水平？

a. 试点的合适周期是多久？

b. 应设置哪些中期里程碑或检查点（例如：入组进展、安全性审查、中期分析）？

c. FDA应如何在快速获取洞察与严格评估之间取得平衡？

a. 应如何记录并传播经验教训？

b. 在保护专有信息的同时，采用何种机制促进透明度？

B. 评估指标与成功标准

FDA 就试点评估的适当指标与方法征求意见，包括：

a. 应如何衡量试验效率的改进（例如：启动、入组或完成所需时间）？

b. 应采用哪些指标评估从I期完成到II期启动的时间缩短？

c. 应如何量化受试者筛选、招募效率与受试者留存的提升？

a. 应如何评估继续/终止（go/no-go）决策的质量与及时性（包括FDA监管决定与申办方内部决策点）？

b. 采用何种方法评估AI支持的决策与传统决策之间的一致性？

c. 应如何衡量由于早期阶段决策改进而导致的后期试验失败率下降？

a. 应采用哪些指标评估安全信号的发现与响应时间？

b. 应如何评估AI对不良事件发生率或方案偏离的影响？

c. 采用哪些措施评估数据完整性（完整性、准确性、一致性）的改进？

a. 评估AI模型准确性、稳健性与泛化能力的最佳指标为何？

b. 应如何测量AI系统随时间的稳定性，包括模型漂移的检测与缓解？

c. 如何在不同人群、试验中心与治疗领域间评估其表现？

a. 应提供何种证据以证明AI系统在临床试验情境中的有效性与可靠性？

b. 应如何评估与AI系统相关的安全与风险缓解？

c. 针对不同利益相关方，哪些指标可用于评估透明度与可解释性？是否存在既适用于申办方自研系统又适用于专有系统的通用指标？

d. 应如何评估隐私保护与数据治理实践？

e. 应采用何种方法评估跨人口统计学与临床亚组的公平性？

a. 最合适的对照为何（例如：历史对照、同期非AI试验、模拟研究）？

b. 在比较中应如何处理试验设计、复杂性或治疗领域差异？

a. 应如何评估利益相关方对AI赋能试验方法的信任度（例如：研究者、受试者、监管机构）？

b. 采用何种方法评估可用性与在临床工作流程中的整合？

c. 应如何衡量感知价值、可扩展性与运营可行性？

Grace R. Graham

政策、立法与国际事务副局长

脚注

15 U.S.C. 9401(3)（亦见 FDA《用于支持药品和生物制品监管决策的人工智能使用考量》草案指南）： “人工智能”一词指一种基于机器的系统，该系统可针对一组人类定义的目标，做出影响真实或虚拟环境的预测、建议或决策。人工智能系统使用机器和人类输入以：

（A）感知真实与虚拟环境；

（B）通过自动化分析将上述感知抽象为模型；以及

（C）使用模型推理形成信息或行动方案。

[2]

NIST AI 风险管理框架（AI RMF）可在以下网址获取：https://www.nist.gov/itl/ai-risk-management-framework。

[3]

《用于支持药品和生物制品监管决策的人工智能使用考量》可在以下网址获取：https://www.fda.gov/regulatory-information/search-fda-guidance-documents/considerations-use-artificial-intelligence-support-regulatory-decision-making-drug-and-biological。

← 上一篇：AI 赋能智慧课堂：课题申报高分指南下一篇：中小企业必看：揭秘高转化AI数字人方案 →