AI模型精准预测人体细胞衰老轨迹
格莱斯顿研究机构推出了一款创新工具,该工具基于人类寿命数据进行训练,能够预测与衰老及相关疾病密切相关的基因表达模式。
你身体的每个组织每日都在经历老化过程。数十年的时光里,你的心脏、大脑和肺部细胞会逐渐发生转变,从而提高罹患心脏病、老年痴呆以及其他年龄相关疾病的风险。
长期以来,科研人员一直致力于描绘这些变化的图谱,但大多数研究仅能捕捉细胞的单一瞬间,未能展现衰老如何动态演变的宏观图景。
近期,格莱斯顿研究所的科学家们与英伟达公司携手合作,成功构建了一个人工智能模型,能够追踪全身细胞随时间推移的分子特征变化。
最终,这一成果将帮助他们识别可用于延缓或逆转年龄相关疾病细胞变化的药物或其他干预措施,这些疾病包括心脏病和老年痴呆症。
格莱斯顿研究团队的医学博士克里斯蒂娜·西奥多里斯指出,衰老过程绵延漫长,在实验室中几乎无法在人类细胞上模拟。她的团队正是基于这一考量开发了该模型。这个模型的亮点在于,我们能够借助它锁定最具潜力的抗衰老靶点,从而规避衰老研究中那种耗资巨大的长期实验。
为评估模型性能,西奥多里斯与合作者运用人工智能模型分析心脏细胞,并让其预测加速或延缓正常衰老的基因。当研究人员在人类细胞中验证这些基因的作用时,预测结果得到确认:激活促衰老基因会导致细胞呈现衰老特征,如不规律跳动和炎症相关基因活动。
构建跨越数十年的预测模型
此前,西奥多里斯的实验室已研发出Geneformer,这是一款基于人类细胞数据的基础人工智能模型,通过分析数百万健康和疾病状态的人类细胞来揭示基因的协同作用机制。该工具虽能预测单个细胞对基因变化的反应,但仅限于单一时间点。
这款新型时间序列人工智能模型被命名为MaxToki——灵感来源于日本新干线列车,其名称取自日语“时间”的谐音——它在Geneformer的基础上新增了全程追踪组织衰老过程的功能。
西奥多里斯的团队使用近1.7亿个健康人类细胞的精细数据来训练MaxToki,这些细胞来自从出生到90多岁不同年龄段的健康个体。该模型不再将每个细胞视为孤立的瞬间切片,而是学习预测任意细胞类型的基因活性如何随年龄增长而变化。
构建MaxToki面临的主要挑战在于庞大的计算规模。训练该模型需要处理近一万亿个基因数据token,这一数据量接近训练ChatGPT等大型语言模型所需的规模。
为使这一工作在实际学术实验室中可行,格莱斯顿与英伟达合作加速关键底层代码,使其能在专用的英伟达人工智能基础设施和加速计算平台上更高效运行。格莱斯顿利用英伟达BioNeMo和CUDA-X库来优化训练吞吐量和效率。
本研究测试了MaxToki模型能否识别其从未学习过的事物:伴随某些疾病出现的加速衰老现象。
英伟达数字生物学主管安东尼·科斯塔表示,即便在最先进的实验室中,也需要在近一万亿基因token上训练模型,这一庞大的计算规模构成了主要障碍,迫切需要加速计算来处理这些大规模时间序列数据集。通过利用英伟达BioNeMo和英伟达CUDA-X库,我们为格莱斯顿团队提供了在短时间内训练十亿参数模型所需的算法吞吐量和内存效率。此次合作将使全球研究人员能够使用MaxToki快速识别抗衰老靶点,并以超过400倍的速度发现延缓或预防老年痴呆症和心脏病等年龄相关疾病的新方法。
疾病伴随的衰老进程
由于MaxToki是专门依据健康个体数据训练的,该团队得以测试它能否识别从未学习过的事物:伴随某些疾病出现的加速衰老。当输入肺纤维化患者的肺细胞数据时,模型计算显示,与健康对照组相比,这些细胞的衰老速度加快了15年。重度吸烟者的细胞则显示出5年的加速衰老。
在一组阿尔茨海默病患者的数据中,MaxToki检测到小胶质细胞(大脑免疫细胞)约有三年的衰老加速。格莱斯顿研究员安德鲁·杨博士提供的第二个数据集也呈现了类似的衰老加速现象。然而,在该数据集中,脑部存在阿尔茨海默病病理变化但未出现痴呆症状的患者的小胶质细胞中未观察到相同的衰老加速,这一现象被称为阿尔茨海默病的恢复力。
该研究第一作者、西奥多里斯实验室的生物信息学研究员哈维尔·格马斯梅斯·奥尔特加博士指出,人工智能仅接受过正常衰老的训练,但它正确地识别出了疾病细胞的加速衰老。运用该模型有助于我们识别导致年龄相关疾病的基因活动的特定变化,并指明延缓或预防这些疾病的潜在策略。
基于这一目标,研究团队使用MaxToki筛选心室心肌细胞(心脏的主要泵血细胞)中与衰老相关的基因。人工智能模型标记了数十个候选基因,科学家们与格莱斯顿研究员迈克尔·亚历山大博士合作,选取了五个基因进行实验室验证。
当这五个基因中的每一个在人类心脏细胞中被激活时,产生的基因活动呈现出老年细胞的典型模式,如炎症加剧和线粒体功能紊乱。通过进一步实验,科学家们在细胞中发现了更多衰老特征,包括钙循环减慢和心律不齐。
资深作者克里斯蒂娜·西奥多里斯和她的团队使用MaxToki分析心脏细胞,并委托它预测加速或减缓正常衰老的基因。当研究人员在人类细胞中验证这些基因的影响时,预测结果是正确的。
西奥多里斯表示:“这些都是我们原本不会测试的靶点。”观察到它们引起的心脏细胞功能衰退,以及我们与人类心脏衰老相关联的那种变化,证实了该模型捕捉到了生物学上的真实规律。
研究团队在幼鼠身上进行了早期测试,发现激活前两个促衰老基因会在一个月内导致心脏功能障碍的迹象,这表明这些基因在衰老过程中发挥着功能性作用。研究人员目前正在测试阻断相同基因是否能防止年龄相关的心脏衰退。
预训练的MaxToki模型和代码已公开,全球研究人员可将其应用于各自关注的衰老和疾病研究。
参考文献
Temporal AI model predicts drivers of cell state trajectories across human aging