这次研究一共纳入了106篇相关研究,其中有35篇(包含28篇ML相关、7篇DL相关)能够提供可分析的数据,覆盖的研究对象有29130例。ML方法里,最常用的算法是Logistic回归(LR);DL方法里,最常用的是神经网络(NN)(图1、图2)。
图2. 报告指南的106项符合资格的研究对预测建模研究系统评价(CHARMS)关键评估与数据提取C检查清单的依从性总结
常用的预测因素包括年龄、BMI、转氨酶、糖化血红蛋白、2型糖尿病(T2DM)这些(表1、表2)。
表1. 具备机器学习模型分析所需数据的28项合格研究特征(上下滑动查看全图)
表2. 具备深度学习模型分析所需数据的7项合格研究特征(上下滑动查看全图)
一共纳入了14项研究,涉及9308例研究对象。ML的合并AUROC是0.833(95%CI: 0.806-0.860),DL的合并AUROC是0.841(95%CI: 0.782-0.900)。
其中ML里面,LightGBM模型表现最好,AUROC达到0.920;DL里面,ResNet50模型最优,AUROC有0.960(图3A、图3B)。
图3. 用于诊断MASH的AUROC曲线下面积森林图
纳入了24项研究,覆盖20985例研究对象。ML合并AUROC为0.826(95%CI: 0.792-0.860),DL合并AUROC是0.875(95%CI: 0.816-0.934)。
ML中CatBoost模型表现最佳,AUROC 0.960;DL中则是CNN模型最优,AUROC 0.917(图4A、图4B)。
显著纤维化(≥F2):纳入12项研究,共15299例研究对象,CatBoost模型最优,AUROC 0.960(图5A)。
进展期纤维化(≥F3):11项研究纳入,涉及10581例,FIB-12(基于ADORE)模型表现最好,AUROC 0.911(图5B)。
肝硬化(F4):纳入6项研究,共7496例,SVM模型最优,AUROC 0.956(图5C)。
图5. 基于机器学习模型诊断不同肝纤维化分期的AUROC曲线下面积森林图
地理区域:诊断MASH时,亚洲研究里LightGBM模型最优(AUROC 0.920),非亚洲研究中XGBoost模型表现最好(AUROC 0.923);诊断纤维化时,非亚洲研究里CatBoost模型最优(AUROC 0.960)。
集成与非集成方法:集成方法中,LightGBM、CatBoost、FIB-12、RF这几个模型,分别在MASH、显著纤维化、进展期纤维化、肝硬化中表现最佳;非集成方法里,SVM模型在各个纤维化阶段,表现都比较稳定且有优势。
发表年份:2013-2022年期间,MASH诊断中GB模型最优,纤维化各个阶段都是SVM模型表现最好;2023-2025年,MASH诊断里LightGBM模型最优,显著纤维化、进展期纤维化、肝硬化,分别是CatBoost、FIB-12、LR模型表现最佳。
图5 | 骨髓(BM)与外周血(PT)样本中的单核细胞具有 distinct functions 并可预测免疫治疗效果