标签

RIGPS:强化学习驱动的无标签单细胞基因筛选新方案

发布时间:2026-05-02 01:36来源:微信阅读:6

伴随着单细胞RNA测序(scRNA-seq)技术的迅猛进步,我们能够深入到单细胞层面去监测基因的表达情况,为疾病探究、药物研发及精准医疗开启了全新视界。不过,这项技术也引发了一个严峻难题——如何在浩如烟海的基因中,精准甄选出最具生物学价值的“关键Marker基因”?特别是大部分测序数据缺乏真实标签,在这些无标签的数据中,这一任务更是难上加难。

近日,中国科学院计算机网络信息中心科学数据智能与创新实验室团队(DI4Science Lab或DSL)携手新加坡科技研究局(A*STAR)、杜克-新加坡国立大学医学院(Duke-NUS Medical School)等研究机构,在《IEEE Transactions on Computational Biology and Bioinformatics》上发布了一项成果,提出了一种基于强化学习的知识引导型基因面板筛选框架——RIGPS(Reinforced Iterative Gene Panel Selection),为无标签单细胞数据的深度分析提供了一种全新的解决思路。

在单细胞数据分析中,基因挑选是后续分析(如聚类、可视化、差异基因表达分析)的核心前提,也是单细胞分辨率下基因标注的关键环节。传统方法主要包含三类:

降维手段(如PCA、t-SNE、UMAP):虽能压缩数据,却容易遗失关键的生物学信号。

统计手段(如高变基因、差异表达):对噪声和稀疏性较为敏感,容易误筛或漏筛。

嵌入式模型或启发式算法:依赖人工经验或局部最优,缺乏全局优化能力,稳定性较差。

更重要的是,这些方法往往无法在无标签数据中自适应地识别关键基因,也难以应对高维度、高冗余的基因空间。

知识集成初始化:站在“巨人”肩膀上

RIGPS首先融合多种传统基因筛选手段(如Seurat、geneBasis、CellBRF等)的结果,构建一个“先验知识边界”,作为强化学习智能体的初始搜索范围。此举不仅压缩了搜索领域,还有效降低了计算复杂度。

多智能体强化学习:协同探索最优基因组合

RIGPS为每一个候选基因指派一个“基因智能体(gene agent)”,这些智能体在每一轮迭代中协作决定是否保留或剔除某个基因。通过共享状态信息和奖励反馈,智能体们逐步收敛至一个最优基因组合。

专家行为模拟的奖励机制:无标签也能“看懂”生物学意义

RIGPS结合领域专家在细胞类别标注任务中的行为逻辑,设计了一个融合生物可分辨性(Biological Distinctiveness)与基因简洁性(Biomarker Parsimony)的奖励函数:

生物可分辨性:通过聚类结果与伪标签之间的互信息,衡量当前基因组合对细胞类型的区分效力。

基因简洁性:鼓励选择更少的基因,规避冗余,提升模型的泛化能力。

这一机制使得RIGPS在无标签条件下,也能像专家一样判断“哪些基因更为关键”。

研究团队在24个公开scRNA-seq数据集上对RIGPS进行了系统性评估,涵盖人类、小鼠等多个物种,涉及胰腺、大脑、肿瘤等多种组织类型。

图 RiGPS 在多个数据集上取得最优表现

实验结果表明:

在聚类任务中,RIGPS在NMI、ARI、Silhouette Index等指标上全面优于10种主流方法,在19个数据集中排名第一,在全部数据集中综合平均排名第一名。

在可视化、差异表达、热图分析等下游任务中,RIGPS选出的基因组合展现出更强的生物学解释力。

图 RiGPS 所选择基因在Puram 数据集上的下游实验分析

在细胞类型注释任务中,RIGPS预处理的数据集同样表现优异,相较于其他数据预处理方法,处理后的数据集准确率和F1-score均显著提升。

抗噪能力强:在存在批次效应的数据中,RIGPS依然能稳定识别关键基因。

图RiGPS在具有批次效应的数据加上依然具有优秀的性能

收敛速度快:相比传统启发式迭代方法,RIGPS在更短时间内找到更优解。

图RiGPS的模拟实验奖励函数能让其具有更高的收敛效率

模型轻量高效:通过自编码器压缩状态空间,显著降低内存和计算开销。

图RiGPS具有良好的扩展能力

基因组合更精简:在保持高性能的同时,RIGPS选出的基因数量远少于其他方法,极大降低后续实验成本。

图RiGPS仅需选择次优方法1/5的基因,即可达到更优的聚类性能

RIGPS不仅是基因选择技术的一次飞跃,更是人工智能与生命科学深度融合的典范。它突破了传统方法对标签数据的依赖,让AI真正“理解”生物数据的结构与意义。未来,RIGPS有望在肿瘤早筛、免疫治疗、细胞疗法等领域发挥重要作用,助力精准医学迈向新高度。

论文信息:

Xiao, M., Zhang, W., Huang, X., Zhu, H., Wu, M., Li, X., & Zhou, Y. (2025). Knowledge-Guided Gene Panel Selection for Label-Free Single-Cell RNA-Seq Data: A Reinforcement Learning Perspective. IEEE Transactions on Computational Biology and Bioinformatics. 2025

资助信息:

本项目受中国科学院战略性先导科技专项、国家自然科学基金重点项目、北京市自然科学基金青年项目的资助,并得到中国科学院计算机网络信息中心“科学地平线”(SciHorizon)平台的支持。

论文链接:

https://ieeexplore.ieee.org/abstract/document/11164312

注:公众号迁移,原文章发布于2025年9月28日