当前位置：首页>南京>南京中医药大学附属医院BMC 医学信息学新作:自编码器 + UMAP 聚类解析脓毒症心功能障碍异质性,SHAP 赋能精准危重症预后

南京中医药大学附属医院BMC 医学信息学新作:自编码器 + UMAP 聚类解析脓毒症心功能障碍异质性,SHAP 赋能精准危重症预后

2026-06-25 14:00:21

本研究基于 MIMIC-III、MIMIC-IV 两大重症数据库开展回顾性队列研究，先依据 Sepsis-3 标准联合 24h 内心肌损伤生物标志物筛选脓毒症诱导心肌功能障碍（SIMD）患者，剔除合并慢性心脏病、大量缺失数据等人群后完成数据预处理；构建自编码器 - UMAP 降维 + K-means 无监督聚类流水线，通过复合评分体系筛选最优 3 类 SIMD 表型，借助 Kaplan-Meier、Cox 回归验证各亚型预后差异，采用 XGBoost 联合 SHAP 实现亚型判别与模型可解释性分析；同步搭建 4 套预测模型对比全局建模、亚型分层建模、亚型专属特征筛选、多源特征融合策略的 28 天死亡预测效能，最终确定 3 种预后差异显著的 SIMD 临床表型，其中合并代谢性酸中毒、多器官损伤的 2 型为高危亚型，乳酸、胆红素、凝血指标为亚型区分核心变量，仅针对亚型重新筛选特征的 M3 模型预测效果最优，显著优于传统 SOFA 评分与全局模型，证实基于表型分层的可解释 AI 可推动 SIMD 个体化精准重症管理。

研究设计

纳入 MIMIC 双数据库 SIMD 患者，完成人口学、实验室、生命体征基线数据提取与清洗；采用自编码器非线性特征压缩、UMAP 流形降维后 K-means 聚类，结合多重聚类评价指标与自建复合评分筛选稳定亚型；生存分析、多因素 Cox 回归验证亚型预后差异，XGBoost+SHAP 解析亚型区分关键临床指标；构建 4 种不同建模策略预测短期死亡，对比各模型与 SOFA 评分区分度、校准度，明确最优建模方案，最终阐释三类 SIMD 表型临床特征、高危人群核心风险指标与 AI 分层模型临床价值。

研究结论

本研究构建了首个 SIMD 专属无监督表型分型框架，划分的三类亚型对应不同病理生理紊乱状态，与既往泛脓毒症分型存在部分相似但聚焦心脏损伤场景，分型结果可指导分层干预：轻症 0 型常规监护、肝凝血异常 1 型侧重保肝抗凝、高代谢高危 2 型早期代谢支持；SHAP 可解释 AI 弥补传统预测模型黑箱缺陷，亚型专属建模相比 SOFA 评分大幅提升死亡预测能力，为 ICU 分诊、精准临床试验入组提供工具；但研究仅依靠生物标志物定义 SIMD、缺乏统一心脏超声验证易造成病例错分，双数据库均来自同一医疗体系，缺乏多中心外部验证泛化性受限，多步深度学习降维可能丢失低方差关键临床信息，KNN、SMOTE 数据处理方法存在固有偏倚，且无多组学、连续血流动力学数据支撑机制阐释，未来需开展多中心外部队列验证、优化降维算法、开发床旁实时分型预测工具，并开展亚型定向干预临床试验。