
❓为何单细胞转录组数据难以精准解析肿瘤克隆演化,传统方法易受噪声干扰、克隆分型与谱系重建脱节?
❗华大智造、南京大学、中科院杭州医学所团队研发scRevol模型,依托GEO等数据库,基于强化学习构建单细胞肿瘤克隆演化分析框架,通过CNV 嵌入优化、智能聚类、MST 演化树重建,突破传统方法局限。
依托GEO等数据库高效发文,速关注我们,私信解锁专属科研支持!↓↓↓

开发基于强化学习的单细胞肿瘤演化分析模型 scRevol,解决现有方法克隆分型与谱系重建脱节、抗噪声差、准确性不足的问题,实现从单细胞转录组数据中精准识别肿瘤克隆、稳健重建克隆演化轨迹,并揭示克隆异质性与转移、临床表型的关联,为肿瘤演化研究提供高效可靠的计算框架。
模型构建:开发scRevol框架,将无监督聚类转化为马尔可夫决策过程(MDP),采用近端策略优化(PPO)算法优化潜在嵌入,结合KL 散度约束与 PCA 初始化提升训练稳定性与嵌入鲁棒性。
克隆分型:基于优化后的 CNV 嵌入完成细胞聚类,生成稳定克隆标签。
演化树重建:使用最小生成树(MST) 算法,基于克隆中心距离构建肿瘤克隆演化树。
数据来源:依托Figshare 模拟数据集、GEO(GSE161363)肺癌谱系示踪数据、VIB‑KU Leuven 卵巢癌 scRNA‑seq 数据开展验证。
对比与评估:以 K‑means、Leiden、SCEVAN、Clonalscope 为基线,采用LCC、PCD、TC、ARI、NMI等指标量化性能;结合富集分析、差异表达、假时间分析解析克隆功能与转移特征。

scRevol 形成 “标签分配学习→克隆聚类→演化树构建” 完整流程,可稳定从 CNV 矩阵解析肿瘤克隆结构与演化轨迹,适配模拟数据、转移异质性分析、临床生物学挖掘三大场景。

图1.scRevol 用于肿瘤演化建模与生物学解析的工作流程
在 485 组模拟数据中,scRevol 的ARI、NMI、LCC、PCD、TC等指标全面领先 K‑means、Leiden、SCEVAN、Clonalscope 等方法;克隆数目预测准确、谱系拓扑还原度高,高噪声下仍保持稳定,与真实克隆高度匹配。

图2.基于模拟数据的性能评估。(A) 各方法的平均ARI与NMI值

图3.克隆群特征及谱系间转移异质性分析

图4.基于 scRevol 分析解析克隆演化与功能动态
明确卵巢、大网膜、腹膜的克隆分布,识别跨组织共享克隆 C5与部位特异亚克隆;演化时序与假时间吻合,早期克隆富集免疫相关通路,晚期克隆富集 TGFβ/WNT 等免疫抑制通路,完整呈现肿瘤转移演化规律。

图5.基于 scRevol 推断的高级别浆液性卵巢癌(HGSOC)克隆动态与功能图谱
小结
本研究成功构建scRevol强化学习框架,依托模拟数据、GEO 谱系示踪数据及卵巢癌单细胞数据库,经聚类优化与演化树重建,实现肿瘤克隆精准识别与谱系轨迹高效还原。结果显示,该模型在抗噪声、克隆分型、拓扑一致性上全面优于现有方法,可清晰揭示肿瘤转移异质性、原发‑转移亚克隆演化时序及功能特征,为单细胞水平肿瘤克隆演化研究提供稳定可靠的新工具。
专注于用GEO数据做挖掘、生信分析,你也想复刻顶刊研究思路的话,【生信指示灯】就是你的最佳助力!


GBD|NHANES|CHARLS
生信分析|机器学习
数据库联合|个性化分析
◀◀◀长按添加,复刻高分思路

欢迎在评论区留下您感兴趣的领域,「生信指示灯」将每日为您精选并解读前沿高分文献。关注我们,持续获取生信前沿洞见。
▼往期回顾▼
IF11!华大基因领衔联合研究,凭CNGB+机器学习成果拿下 1 区顶刊,解锁神经精神疾病微生态精准诊疗新范式!
IF13!问鼎 Q1 顶刊!中山大学肿瘤防治中心团队凭TCGA+GEO + 临床队列精准预测食管癌预后与免疫治疗疗效!
IF52.70!顶尖成果!广医一院牵头:借MR+UKB/GWAS等数据库登顶《STTT》1区TOP刊,揭示慢阻肺进展新机制,点亮精准治疗新方向!
IF10.60!实力出圈!东南大学团队凭NHANES深耕 CKM 综合征成果斩获1 区顶刊,为心肾代谢综合征精准分层提供关键依据!