标签

AI赋能ADC设计:为“生物导弹”装上智能导航系统

发布时间:2026-05-02 18:22来源:微信阅读:6

早期的ADC研发主要依赖X射线晶体学与分子对接技术,然而抗体中那些柔性的区域(例如CDR-H3环)以及完整的IgG结构往往难以解析。虽然分子动力学模拟能展示动态细节,但其受限于高昂的计算开销以及力场精度的不足。

人工智能与机器学习的加入彻底颠覆了这一局面。深度学习能够从庞大的序列-结构数据集中自动提取关键特征,从而预测抗体的可开发性、优化连接子结构并筛选毒素与抗体的最佳组合。现在的ADC研发已从单纯的“试错法”迈向了“预测驱动”的新阶段。

主线一:经验筛选 → AI预测 → 理性设计

AlphaFold2虽能以接近实验的精度预测单体蛋白,但在面对抗体高变区CDR-H3时仍显得力不从心。AlphaFold-Multimer开始涉足抗体-抗原复合物,而最新的AlphaFold3更进一步:它采用扩散生成框架,可同时预测蛋白质、核酸、小分子、离子及糖基化修饰的复合物结构。

对于ADC而言,AlphaFold3能够预测Fc结构域的N-糖基化、linker-payload的静态构象以及抗体-抗原结合位点。尽管目前仍难以精准捕捉糖基的微小异质性和柔性linker的动态行为,但这为ADC的结构建模提供了前所未有的良好开端。

此外,DeepAb、ABlooper、IgFold等专用工具针对CDR环区进行了精细优化,显著提升了建模的准确性。

主线二:单体结构 → 复合物预测 → 完整ADC建模

传统抗体亲和力成熟主要依赖噬菌体展示库筛选,过程繁琐且耗时。生成式AI正在重写这一流程:

GANs和VAEs:例如PALM-H3、Ig-VAE,能在保持结构合理性的基础上生成多样化的CDR-H3序列,引入功能多样性。

Transformer模型:AntiBERTa、AbLang等预训练模型从抗体序列库中学习“语法”,用于预测结构、评估人源化程度,甚至修复缺失的氨基酸残基。

扩散模型:DiffAb、EvoDiff能直接生成符合特定结构约束(如表位曲率、溶剂可及性)的抗体变体,实现序列与结构的协同设计。

这些工具让ADC开发者能够在计算机中“模拟进化”,快速产出候选分子。

主线三:序列数据库 → 生成模型 → 虚拟抗体库

ADC的成功不仅取决于抗体本身,更依赖于linker-payload的完美匹配。AI/ML已被广泛应用于:

预测DAR(药物-抗体比):ML模型可根据抗体序列和偶联化学,预测最佳载药量。

设计智能linker:结合分子模拟与神经网络,预测linker在血浆中的稳定性、细胞内释放动力学及空间位阻。DiffDock等扩散模型可模拟linker-抗体-payload三元复合物的结合构象。

预测ADMET:集成学习模型可评估ADC的溶解度、聚集倾向、清除率及免疫原性,从而在后期阶段前规避失败风险。

特别值得一提的是,Neural-ODE(如ADCnet)能连续模拟ADC的内化、linker切割及药物释放的动态过程,捕捉非线性的药代动力学特征。

主线四:静态结构 → 动态模拟 → 可开发性预测

尽管前景广阔,AI驱动的ADC设计仍面临诸多挑战:

数据稀缺:多数ADC专有数据未公开且标注不一。迁移学习、数据增强和自监督学习可在有限数据下提升性能。

模型可解释性:黑箱神经网络难以满足监管要求。注意力机制和归因图有助于理解模型决策逻辑。

动态复杂性:ADC的多组分协同效应难以用静态结构完全描述。未来需整合多模态数据(结构、组学、临床)和强化学习闭环,实现“设计-预测-实验-优化”的自动化迭代。

展望新一代多聚体ADC、双特异性ADC和模块化payload系统,AI将不仅局限于优化现有分子,更将创造出前所未有的复杂构型。

主线五:数据/AI → 预测/验证 → 闭环优化 → 下一代ADC

从结构预测的“原子望远镜”到生成序列的“虚拟进化”,从linker动态模拟到药代动力学建模——AI正将ADC研发从一门传统手艺转变为严谨的工程科学。尽管在数据、解释性和动态模拟方面仍有瓶颈,但一个由AI驱动、可迭代优化的ADC开发新范式已然成型。未来,当“生物导弹”能通过算法持续自我进化,癌症靶向治疗或将迎来真正的智能化时代。

参考文献:Noriega & Wang, Frontiers in Drug Discovery, 2025, 5:1628789