IF13.0 !南京医科大学用 “机器学习 + SHAP”斩获一区TOP!破解轻微中风预后难题!
🩺轻微中风虽症状温和,但复发与致残风险不容小觑,传统影像预测模型常忽视病灶空间特征。🔬南京医科大学团队创新构建空间影像组学可解释模型,融合多维度空间特征与机器学习,为轻微中风预后精准预测提供生信分析新方案。
首次将病灶空间特征(位置、结构 / 功能断开)与传统影像组学结合,构建空间影像组学模型,预测 AUC 高达 0.95,显著优于传统模型。
基于 7 个中心 4164 例大样本验证,采用 XGB 与堆叠集成算法,模型泛化能力与稳定性强,适配临床多中心场景。
借助 SHAP 分析明确病灶断开是核心预测因子,破解模型 “黑箱”,为临床干预提供明确靶点。
专注生信解析痛点,关注生信云解析,你的下一篇高分成果,或许就从这里破局!
轻微中风预后差异大,传统影像组学依赖感兴趣区域分析,忽略病灶空间拓扑特征,导致预测准确性与可解释性不足。
研究旨在开发整合病灶多维度空间特征的可解释机器学习模型,提升轻微中风不良预后预测精度,为临床决策提供支撑。
收集 7 中心 4164 例轻微中风患者 DWI 数据,提取病灶位置、结构 / 功能断开等空间特征及传统影像组学特征;
构建 XGB、堆叠集成等 6 种模型,经多队列验证性能;
采用 SHAP 分析解析模型关键预测因子,可视化特征贡献。
图1 研究流程图
生信分析,专业定制,紧跟前沿!
高效落地,助力高分!
多数据库联合、机器学习、GBD2023、孟德尔随机化队列构成:7 家中心共纳入 2815 例轻微中风患者(NIHSS 评分≤5),分为 2088 例训练队列、295 例独立验证队列 1、432 例真实世界验证队列 2,基线特征总体一致;
核心特征:训练队列平均年龄 65.0 岁,男性占 72.9%,高血压(71.7%)、糖尿病(67.4%)为主要基础病;不良预后发生率 16.91%,病灶分割 Dice 系数 0.96,一致性良好;
治疗与预后:训练队列中 79.0% 采用保守治疗,16.91% 出现不良预后,验证队列 1、2 不良预后发生率分别为 7.46%、21.1%,无死亡病例。
表1 该队列的基线特征
关键空间指标:位置特征(LOC)中半卵圆中心、小脑梗死与不良预后相关;结构断开(SDC)中双侧皮质脊髓束、左侧脊髓小脑束受累风险升高;功能断开(FDC)中运动区、默认模式网络等存在负向预测权重(均 P<0.05);
核心预测特征:空间影像组学模型的 Top10 特征与影像组学、LOC、SDC、FDC 及空间组学单模型核心特征高度重叠,保留了最具预测价值的空间与影像信息,且病灶断开特征优先级高于单纯位置特征。

图2 LOC、SDC 和 FDC 空间特征中病变的概率图

图3 轻度中风不良结局的十大重要特征及权重
模型优选:XGB 与堆叠算法表现最佳,空间影像组学模型(临床 + 影像组学 + 空间特征)在训练队列 AUC 均达 0.95,验证队列 1/AUC 0.88/0.89,验证队列 2/AUC 0.87/0.89,泛化能力稳定;
性能优势:较传统影像组学模型,XGB / 堆叠模型 NRI 分别为 0.180/0.290、IDI 分别为 0.145/0.230(均 P<0.01),鉴别能力显著提升;DCA 分析显示模型具备临床净获益,风险评分更集中于真实不良预后患者;
算法对比:6 种算法中,基于空间组学特征的模型性能最优(AUC 0.79-0.94),XGB 算法表现最佳(AUC 0.94),传统 LR、ADB 等算法的影像组学模型性能有限(AUC 0.70-0.79)。

表2 基于影像组学和不同空间特征的机器学习模型在训练队列中预测不良结局的AUC值

图4 XGB模型和堆叠模型在训练队列和验证队列中的表现

表3 预测轻微脑卒中患者不良结局的XGB和堆叠模型的性能

表4 基于不同类型影像组学的不同模型的预测性能
图5 基于空间影像组学的XGB模型的解释与可视化采用 SHAP分析
本文通过整合多中心影像数据与多维度空间特征,运用机器学习与 SHAP 解释方法,系统阐述了空间影像组学模型的构建与验证流程,揭示了病灶断开而非单纯位置是轻微中风预后的核心影响因素,为生信分析领域开展神经疾病的空间组学研究提供了范式,也为中风精准预后评估与个体化干预的生信分析指明了新方向。
想用机器学习进行研究?高分思路一键复现,联系即可解锁,生信云解析,科研赋能不费力!
生信云解析
微信号:7092509
生信云解析护航 微信咨询即刻出发
公共数据库 机器学习 孟德尔随机化 多组学 虚拟敲除