标签

AI+科研周报|组学与单细胞AI新进展

发布时间:2026-05-12 14:50来源:微信阅读:6

本期覆盖时间:2026.04.29-2026.05.12

封面图:AI 生成|组学与单细胞 AI 主题配图

本期周二栏目继续聚焦“组学与单细胞 AI”。这两周的文章有一个很明显的变化:AI 不再只是给组学表格做分类,而是在尝试改写数据进入科研问题的方式。

最值得注意的是,空间组学和病理图像开始更紧地接在一起。Path2Space 用病理切片预测空间基因表达,把昂贵的空间转录组实验转成可以在大队列里扩展的推断流程。这对做组织结构、炎症微环境、肿瘤微环境或口腔组织空间异质性的人,启发很直接:图像不只是配图,它可能成为组学空间预测的入口。

另一条主线是单细胞基础模型正在变得更“懂生物”。RegFormer 把基因调控网络先验放入模型结构,CAPTAIN 则直接用 RNA 和蛋白共测数据做多模态预训练。它们都在回答同一个问题:细胞状态不能只靠转录本描述,模型需要看见调控层级、蛋白层读数和跨模态依赖。

本期按 7 篇文章展开:前四篇作为主文,分别对应空间表达预测、单细胞调控基础模型、RNA/蛋白多模态模型和增强子-基因调控连线;后三篇作为延伸阅读,补上空间多组学整合、单细胞/空间蛋白组融合和 scATAC 细胞类型注释。

先用一张图看本期 7 篇文章的结构:从图像到空间表达,从转录组到蛋白层,从细胞注释到调控网络,AI 正在把“多模态数据”变成可推断、可迁移、可复用的科研流程。

本期正式解读如下。

研究背景:空间转录组能把基因表达放回组织结构里,但成本和通量限制了它在大样本队列中的应用。病理切片几乎是很多队列都已有的数据,如果能从 H&E 图像预测空间表达,就有机会把空间组学问题带到更大的样本规模。

方法亮点:作者提出 Path2Space,用深度学习模型从乳腺癌病理图像直接预测空间基因表达。模型在空间转录组数据上训练,并用于推断大量 TCGA 乳腺癌样本的空间肿瘤微环境特征。文章还把预测表达进一步转成细胞类型丰度、空间亚型和治疗反应相关指标。

主要结论:Path2Space 可以较稳定地预测数千个基因的空间表达,并从 976 个乳腺癌样本中推断出具有不同预后和治疗反应特征的空间微环境亚型。它的核心价值不是替代空间转录组实验,而是在已有病理图像中生成可筛选的空间组学假设。

启发与迁移:这篇非常贴近“影像 + 组学 + 机制”的迁移方向。做口腔黏膜、牙周炎症、骨缺损修复或肿瘤微环境时,如果已有组织图像和少量空间组学训练数据,类似思路可以帮助我们先在大样本图像中定位空间表达趋势,再回到实验里做验证。

▍文献信息 英文标题:AI-predicted spatial transcriptomics unlocks breast cancer biomarkers from pathology 期刊/平台:Cell 第一作者:Eldad D. Shulman 通讯作者:Eldad D. Shulman 等 单位:Cancer Data Science Laboratory, National Cancer Institute;University of Maryland;Sungkyunkwan University 等 DOI:10.1016/j.cell.2026.04.023 公开资源:代码和教程:https://zenodo.org/records/14729337;论文 DOI:https://doi.org/10.1016/j.cell.2026.04.023