
本研究基于 MIMIC-III、MIMIC-IV 两大重症数据库开展回顾性队列研究,先依据 Sepsis-3 标准联合 24h 内心肌损伤生物标志物筛选脓毒症诱导心肌功能障碍(SIMD)患者,剔除合并慢性心脏病、大量缺失数据等人群后完成数据预处理;构建自编码器 - UMAP 降维 + K-means 无监督聚类流水线,通过复合评分体系筛选最优 3 类 SIMD 表型,借助 Kaplan-Meier、Cox 回归验证各亚型预后差异,采用 XGBoost 联合 SHAP 实现亚型判别与模型可解释性分析;同步搭建 4 套预测模型对比全局建模、亚型分层建模、亚型专属特征筛选、多源特征融合策略的 28 天死亡预测效能,最终确定 3 种预后差异显著的 SIMD 临床表型,其中合并代谢性酸中毒、多器官损伤的 2 型为高危亚型,乳酸、胆红素、凝血指标为亚型区分核心变量,仅针对亚型重新筛选特征的 M3 模型预测效果最优,显著优于传统 SOFA 评分与全局模型,证实基于表型分层的可解释 AI 可推动 SIMD 个体化精准重症管理。

研究设计

纳入 MIMIC 双数据库 SIMD 患者,完成人口学、实验室、生命体征基线数据提取与清洗;采用自编码器非线性特征压缩、UMAP 流形降维后 K-means 聚类,结合多重聚类评价指标与自建复合评分筛选稳定亚型;生存分析、多因素 Cox 回归验证亚型预后差异,XGBoost+SHAP 解析亚型区分关键临床指标;构建 4 种不同建模策略预测短期死亡,对比各模型与 SOFA 评分区分度、校准度,明确最优建模方案,最终阐释三类 SIMD 表型临床特征、高危人群核心风险指标与 AI 分层模型临床价值。

研究结论

本研究构建了首个 SIMD 专属无监督表型分型框架,划分的三类亚型对应不同病理生理紊乱状态,与既往泛脓毒症分型存在部分相似但聚焦心脏损伤场景,分型结果可指导分层干预:轻症 0 型常规监护、肝凝血异常 1 型侧重保肝抗凝、高代谢高危 2 型早期代谢支持;SHAP 可解释 AI 弥补传统预测模型黑箱缺陷,亚型专属建模相比 SOFA 评分大幅提升死亡预测能力,为 ICU 分诊、精准临床试验入组提供工具;但研究仅依靠生物标志物定义 SIMD、缺乏统一心脏超声验证易造成病例错分,双数据库均来自同一医疗体系,缺乏多中心外部验证泛化性受限,多步深度学习降维可能丢失低方差关键临床信息,KNN、SMOTE 数据处理方法存在固有偏倚,且无多组学、连续血流动力学数据支撑机制阐释,未来需开展多中心外部队列验证、优化降维算法、开发床旁实时分型预测工具,并开展亚型定向干预临床试验。

研究结果

本文中使用的图片来源于Pubmed,因客观原因未能与权利人取得联系。本平台出于学术交流目的引用,无意侵犯原作者权益。如权利人认为不妥,请及时联系公众号后台,我们将立即删除或协商解决。
生物信息学课题设计及指导实录,目前生信是否还适用于课题及文章?看专家给你解答