IF7.6!南京大学医用“机器学习+SHAP 解释” 拿下双一区TOP,GBM+脊柱骨盆框架精准预测FL骨髓受累!
滤泡性淋巴瘤有没有骨髓受累,非得挨一针活检才能知道吗?《Eur J Nucl Med Mol Imaging》上,南京大学医学院团队给出了一个不走寻常路的答案:PET/CT加上机器学习,还真有可能提前看出来。
他们分析了187例初诊患者,发现脊柱联合骨盆的影像组学模型,比只看骨盆准得多。最后锁定的梯度提升机(GBM)模型,验证集AUC高达0.906,不用穿刺也能把骨髓受累的底牌摸个七八分。
LITERATURE INTERPRETATION●中文标题:基于PET/CT的可解读放射学临床模型用于预测滤泡性淋巴瘤中骨髓受累情况:比较盆腔与脊柱-骨盆VOI框架
●发表期刊:Eur J Nucl Med Mol Imaging
滤泡性淋巴瘤有没有骨髓受累,直接决定分期和预后,谁都绕不开。可现在的金标准还是骨髓活检,不光疼、取样局限,还只能看一个点。PET/CT虽然能扫全身,但光靠肉眼瞅或者看个SUV值,漏诊误诊都不少。所以临床上一直缺一个不挨针、又能准确判断的办法。
该研究一共入了187例滤泡性淋巴瘤患者,按骨盆和脊柱‑骨盆两个框架从PET/CT里挖特征——临床指标、常规影像、影像组学、深度学习全都要。先用LASSO+ Boruta筛一波,再跑7种机器学习模型比高低。最后拿SHAP拆模型,看看到底哪些特征说了算。
表1的结果挺有意思,骨髓受累那组在区域淋巴结受累、B症状、大淋巴结、贫血、LDH和β2‑MG上明显更差,说明BMI患者整体肿瘤负担更高。但光靠临床指标不够,比如SUVmean在脊柱‑骨盆框架下就失去了独立性。好在LNR和β2‑MG依然能打,想摸清骨髓异质性还得靠后面的影像组学。(表1)。
研究者先按BMI状态把患者分成两组,用Wilcoxon秩和检验比连续变量,Fisher精确检验比分类变量。这一步不急着上模型,而是先看看两组在临床和常规PET指标上到底哪儿不同。值得学的是先描述后筛选的思路,能快速抓住核心差异,也给后续建模省了不少弯路。
图1把特征筛选的流程画得很清楚,先做单因素、去冗余、多因素筛选,高维特征走LASSO+Boruta两步法。这种分层筛选既控制共线性又避免过拟合。可惜脊柱‑骨盆框架下SUVmean被筛掉没在图中体现,但思路值得学,先粗筛再精筛更聪明(图1)。
先跑单因素logistic回归筛出候选特征,再用Spearman相关剔除相关系数≥0.8的冗余变量,最后用Firth惩罚似然法做多因素回归锁定独立因子。高维特征则走LASSO初筛+Boruta二次确认。值得学的是分层筛特征:临床影像特征靠统计降维,组学特征靠算法压维,避免共性和过拟合。
梯度提升机GBM在验证集上AUC达到0.906,精确度和特异度都超过0.92,明显优于其他模型。随机森林和AdaBoost在训练集上表现完美,但一到验证集就明显下滑,过拟合风险藏不住。好在GBM把拟合和泛化平衡得不错,加上校准曲线和决策曲线都挺给力,说明小数据集上选它确实靠谱(图2)。
先固定六种建模方案,分别对应不同VOI和特征组合。每种方案下跑七种机器学习算法,用重复10折交叉验证调参,最后在独立验证集上比AUC。值得学的是先定方案再选算法的思路,以及不光看AUC,还要结合校准曲线和决策曲线综合判断,避免被交叉验证的漂亮数字带偏。
图3把模型的决策逻辑拆开了,LNR贡献最大,但纹理特征如PET‑Wav‑HLL‑NGTDM‑Strength紧随其后,说明骨髓异质性比单纯代谢高低更重要。遗憾是β2‑MG排位靠后,可能被影像特征稀释。好在SHAP让黑箱变灰,这种可解释性在临床上很实用,也能增加医生对模型的信任(图3)。
模型训练完后,用SHAP算每个特征对预测结果的边际贡献,按平均绝对值排序画出特征重要性图,还能看特征值高低对预测方向的影响。值得学的是不只报告特征排名,还展示SHAP方向,能清楚知道某个指标升高是推高风险还是降低风险,临床可解释性大大增强。
不得不说,这项研究把滤泡性淋巴瘤骨髓受累的影像预测讲清楚了。最值得学的是VOI框架对比+分层特征筛选的套路,同一队列硬碰硬比出脊柱‑骨盆方案更优,GBM模型AUC达0.906。
要是你想做肿瘤影像组学却卡在特征冗余或模型可解释性上,参考这套LASSO+Boruta+SHAP组合拳准没错。原文干货满满,值得一读~