当前位置：首页>南京>IF7.6!南京大学医用“机器学习+SHAP 解释” 拿下双一区TOP,GBM+脊柱骨盆框架精准预测FL骨髓受累!

IF7.6!南京大学医用“机器学习+SHAP 解释” 拿下双一区TOP,GBM+脊柱骨盆框架精准预测FL骨髓受累!

2026-05-26 17:33:15

引

言

滤泡性淋巴瘤有没有骨髓受累，非得挨一针活检才能知道吗？《Eur J Nucl Med Mol Imaging》上，南京大学医学院团队给出了一个不走寻常路的答案：PET/CT加上机器学习，还真有可能提前看出来。

他们分析了187例初诊患者，发现脊柱联合骨盆的影像组学模型，比只看骨盆准得多。最后锁定的梯度提升机（GBM）模型，验证集AUC高达0.906，不用穿刺也能把骨髓受累的底牌摸个七八分。

—文献解读 —

LITERATURE INTERPRETATION

●中文标题：基于PET/CT的可解读放射学临床模型用于预测滤泡性淋巴瘤中骨髓受累情况：比较盆腔与脊柱-骨盆VOI框架

●发表期刊：Eur J Nucl Med Mol Imaging

●发表时间：2026年5月16日

●影响因子：7.6/Q1

研究背景

滤泡性淋巴瘤有没有骨髓受累，直接决定分期和预后，谁都绕不开。可现在的金标准还是骨髓活检，不光疼、取样局限，还只能看一个点。PET/CT虽然能扫全身，但光靠肉眼瞅或者看个SUV值，漏诊误诊都不少。所以临床上一直缺一个不挨针、又能准确判断的办法。

研究方法

该研究一共入了187例滤泡性淋巴瘤患者，按骨盆和脊柱‑骨盆两个框架从PET/CT里挖特征——临床指标、常规影像、影像组学、深度学习全都要。先用LASSO+ Boruta筛一波，再跑7种机器学习模型比高低。最后拿SHAP拆模型，看看到底哪些特征说了算。

—研究结果 —

RESEARCH RESULTS

骨髓受累基线对比

表1的结果挺有意思，骨髓受累那组在区域淋巴结受累、B症状、大淋巴结、贫血、LDH和β2‑MG上明显更差，说明BMI患者整体肿瘤负担更高。但光靠临床指标不够，比如SUVmean在脊柱‑骨盆框架下就失去了独立性。好在LNR和β2‑MG依然能打，想摸清骨髓异质性还得靠后面的影像组学。（表1）。

表1 BMI分组基线特征对比

思路复现：

研究者先按BMI状态把患者分成两组，用Wilcoxon秩和检验比连续变量，Fisher精确检验比分类变量。这一步不急着上模型，而是先看看两组在临床和常规PET指标上到底哪儿不同。值得学的是先描述后筛选的思路，能快速抓住核心差异，也给后续建模省了不少弯路。

临床与组学特征筛选

图1把特征筛选的流程画得很清楚，先做单因素、去冗余、多因素筛选，高维特征走LASSO+Boruta两步法。这种分层筛选既控制共线性又避免过拟合。可惜脊柱‑骨盆框架下SUVmean被筛掉没在图中体现，但思路值得学，先粗筛再精筛更聪明（图1）。

图1 研究设计与分析流程图

思路复现：

先跑单因素logistic回归筛出候选特征，再用Spearman相关剔除相关系数≥0.8的冗余变量，最后用Firth惩罚似然法做多因素回归锁定独立因子。高维特征则走LASSO初筛+Boruta二次确认。值得学的是分层筛特征：临床影像特征靠统计降维，组学特征靠算法压维，避免共性和过拟合。

多模型效能对比优选

梯度提升机GBM在验证集上AUC达到0.906，精确度和特异度都超过0.92，明显优于其他模型。随机森林和AdaBoost在训练集上表现完美，但一到验证集就明显下滑，过拟合风险藏不住。好在GBM把拟合和泛化平衡得不错，加上校准曲线和决策曲线都挺给力，说明小数据集上选它确实靠谱（图2）。

图2 各模型训练集ROC对比

思路复现：

先固定六种建模方案，分别对应不同VOI和特征组合。每种方案下跑七种机器学习算法，用重复10折交叉验证调参，最后在独立验证集上比AUC。值得学的是先定方案再选算法的思路，以及不光看AUC，还要结合校准曲线和决策曲线综合判断，避免被交叉验证的漂亮数字带偏。

SHAP特征贡献解析

图3把模型的决策逻辑拆开了，LNR贡献最大，但纹理特征如PET‑Wav‑HLL‑NGTDM‑Strength紧随其后，说明骨髓异质性比单纯代谢高低更重要。遗憾是β2‑MG排位靠后，可能被影像特征稀释。好在SHAP让黑箱变灰，这种可解释性在临床上很实用，也能增加医生对模型的信任（图3）。