当前位置：首页>南京>IF15.1!南京多院联合登顶npj!SHAP解析刷新干燥综合征诊断标准!

IF15.1!南京多院联合登顶npj!SHAP解析刷新干燥综合征诊断标准!

2026-07-04 17:58:11

引言/YINYAN

干燥综合征是一类高发的全身性自身免疫病，最典型的表现就是常年口干、眼干。很多人误以为只是小毛病，殊不知这种疾病会持续侵袭肺、肾脏、肝脏等多个脏器，造成多系统损伤。受限于疾病早期症状不典型、缺乏专属精准标志物，临床中误诊、漏诊的情况十分普遍。传统检查要么有创痛苦，要么诊断效能有限，给临床诊疗带来不小阻碍。

2025年11月27日，南京大学医学院附属南京鼓楼医院研究团队在《npj Digital Medicine》发布重磅多中心研究，依托常规实验室指标打造AI诊断模型，为干燥综合征的早期筛查开辟了全新路径。

01. 文献解读

中文标题：一种多标准特征集成框架，用于利用常规实验室检测准确诊断干燥综合征医学

发表期刊：npj Digital Medicine

发表时间：2025年11月27日

影响因子：15.1/Q1

02. 研究背景

干燥综合征是一种常见的系统性自身免疫病，其症状不典型，缺乏明确的生物标志物，导致诊断延迟和误诊率高。临床诊断依赖专家评估和多种检查，但现有方法存在成本高、有创或灵敏度不足等问题。

03. 研究方法

图1.患者纳入与队列划分流程图

🔹研究设计与数据：进行多中心回顾性研究，纳入中国三家医院34,958名患者。收集123项常规实验室检查数据，经过清洗、缺失值填补和中心间数据协调等预处理。

🔹特征筛选与模型构建：应用六种特征选择算法和SHAP值分析，从经数据清洗后保留的70个候选特征中筛选出16个核心特征。采用堆叠集成学习，融合五个性能最优的基分类器构建最终SMFIF模型。

🔹模型验证与评估：在内部测试集、内部验证集及独立外部验证集上，以AUC、准确率、召回率等指标全面评估模型性能，并与抗SSA/Ro抗体、ANA等传统标志物进行比较。

04. 研究结果

特征筛选流程

从123项常规血检中筛选出70个有效特征，经6种算法交集+7个基模型SHAP排序，最终确定16个核心特征，通过堆叠集成5个最优模型构建SMFIF（图2）。

特征选择至少用3种不同算法取交集；基模型需包含线性、树型、距离型等不同类型；元分类器优先使用逻辑回归。

图2.SMFIF模型构建与特征选择框架图

SHAP解释

16个核心特征多为肌酐、尿酸、谷丙转氨酶等肝肾代谢指标。7个基模型的特征重要性排序总体趋势一致。个别特征存在中等程度共线性，因临床意义予以保留（图3）。

图3.基于SHAP值的特征重要性分析及特征间相关性热图

模型效能对比

SMFIF模型性能显著优于8种临床常用传统标志物，其中抗SSA抗体AUC仅0.705、ANA为0.709、RF仅0.506（图4）。

图4.SMFIF模型与传统生物标志物诊断性能（AUC）比较

校准与分类

模型预测概率与实际发病概率高度一致。外部验证集仅4例假阳性、18例假阴性，误诊漏诊风险极低（图5）。

校准曲线必须添加y=x完美校准线作为参考；混淆矩阵标注具体人数而非比例；校准度差可用Platt缩放修正。

图5.SMFIF模型在各数据集中的校准曲线与混淆矩阵

个人解读

关于特征筛选的思路：16个核心特征以肝肾代谢指标为主，这一结果值得关注。干燥综合征本质是全身性自身免疫炎症反应，肝肾功能指标的异常可能反映了亚临床水平的全身性受累。常规血检中看似"非特异性"的指标组合在一起，可能比单一的自身抗体更能捕捉疾病的系统性特征，模型不是寻找一个"金标准"，而是利用多个弱信号的叠加效应。

关于模型设计的务实性：研究选择了堆叠集成学习而非复杂的深度学习架构。六种特征选择算法取交集、七个基模型融合，这种"多算法投票"策略降低了单一算法偏倚的风险，提高了模型的稳健性。对于临床应用而言，稳健性往往比极致的AUC提升更具实际意义。

关于临床转化前景：模型仅需常规实验室数据即可运行，理论上可嵌入医院信息系统或体检流程，无需额外检查投入，对基层医院尤为适用。但研究基于回顾性数据，模型在前瞻性场景中的表现及跨人种的泛化能力仍有待验证；且未纳入临床症状和影像学信息，更适合作为筛查工具而非确诊工具。

总结