当前位置：首页>南京>IF13.0!恭喜南京大学医学院附属鼓楼医院李捷团队拿下《 J. Adv. Res.》!ML和DL诊断脂肪肝肝炎及纤维化,揭晓最佳模型!

IF13.0!恭喜南京大学医学院附属鼓楼医院李捷团队拿下《 J. Adv. Res.》!ML和DL诊断脂肪肝肝炎及纤维化,揭晓最佳模型!

2026-05-08 03:12:33

引言

机器学习与深度学习模型能高精度诊断代谢相关脂肪性肝病（MASLD）及其进展——代谢相关脂肪性肝炎（MASH）和肝纤维化，其中整合多源数据的算法表现突出。

南京大学医学院附属鼓楼医院李捷、杭州师范大学附属医院施军平在《Journal of Advanced Research》发表系统综述与Meta分析，评估了AI模型的诊断价值。研究显示，基于AI的无创模型可减少肝活检依赖，助力MASLD早期筛查与精准分层！

从生信角度看，这篇Meta分析工作量扎实，系统梳理了ML/DL在MASLD诊断中的表现，对算法选型很有参考价值。LightGBM、CatBoost和ResNet50表现亮眼，但多数模型缺乏外部验证，泛化能力存疑。另外，可解释性分析偏少，多组学数据融合还有挖掘空间。整体是份不错的“算法测评报告”。

如果大家也想进行同款思路快速复现拿高分，关注筑梦科研并回复关键词“思路”，获取1对1课题设计 + 分析方案，实现一键发文！

文章核心架构速览

文章核心要点已为大家整理好，点击图片一键获取！

文献解读

标题：机器学习和深度学习在代谢功能障碍相关脂肪变性肝病中的应用：系统综述和荟萃分析

发表期刊：Journal of Advanced Research

发表时间：2026年3月

影响因子：IF13.0

研究背景

代谢功能障碍相关脂肪性肝病（MASLD），后续可能会进展成代谢功能障碍相关脂肪性肝炎（MASH）和肝纤维化，一旦发展到这个阶段，患者得肝硬化、肝癌的风险就会明显增加。

目前诊断这块，肝活检虽然是金标准，但它是侵入性的，不适合用来常规筛查；传统的非侵入性检测方法，准确性又不够理想。机器学习（ML）和深度学习（DL）这两种方法，在MASLD诊断里已经显示出一定潜力了，不过目前还没有对它们做过系统的比较分析。

研究思路

检索策略：研究团队系统检索了PubMed、Web of Science、Embase、Cochrane Library这几个数据库，检索时间一直到2025年5月18日。

纳入标准：只纳入年龄≥18岁、经过肝活检或者影像检查确诊为MASLD/MASH的患者相关原创研究，而且必须是使用ML或DL方法开展的。

数据提取：由两个人独立进行文献筛选，提取模型性能相关的数据，整个过程遵循CHARMS清单来做。

结局指标：核心就是比较ML和DL这两种方法，在诊断MASH以及肝纤维化方面的性能，同时找出各自类别里表现最好的模型。

质量评估：采用QUADAS-2工具，对纳入的研究进行质量评估。

统计分析：以AUROC作为效应指标，用MedCalc软件进行分析，根据实际情况采用随机效应模型或者固定效应模型。

筑梦科研

长按图片点击扫一扫

获取1对1课题设计 + 分析方案

研究结果

纳入研究特征

这次研究一共纳入了106篇相关研究，其中有35篇（包含28篇ML相关、7篇DL相关）能够提供可分析的数据，覆盖的研究对象有29130例。ML方法里，最常用的算法是Logistic回归（LR）；DL方法里，最常用的是神经网络（NN）（图1、图2）。

图 1. 系统评价与荟萃分析流程图

图2. 报告指南的106项符合资格的研究对预测建模研究系统评价（CHARMS）关键评估与数据提取C检查清单的依从性总结

常用的预测因素包括年龄、BMI、转氨酶、糖化血红蛋白、2型糖尿病（T2DM）这些（表1、表2）。

表1. 具备机器学习模型分析所需数据的28项合格研究特征（上下滑动查看全图）

表2. 具备深度学习模型分析所需数据的7项合格研究特征（上下滑动查看全图）

ML和DL模型诊断MASH的性能

一共纳入了14项研究，涉及9308例研究对象。ML的合并AUROC是0.833（95%CI: 0.806-0.860），DL的合并AUROC是0.841（95%CI: 0.782-0.900）。

其中ML里面，LightGBM模型表现最好，AUROC达到0.920；DL里面，ResNet50模型最优，AUROC有0.960（图3A、图3B）。

图3. 用于诊断MASH的AUROC曲线下面积森林图

ML和DL模型诊断MASH相关纤维化的性能

纳入了24项研究，覆盖20985例研究对象。ML合并AUROC为0.826（95%CI: 0.792-0.860），DL合并AUROC是0.875（95%CI: 0.816-0.934）。

ML中CatBoost模型表现最佳，AUROC 0.960；DL中则是CNN模型最优，AUROC 0.917（图4A、图4B）。

图4. 诊断肝纤维化的AUROC曲线下面积森林图

ML模型诊断不同MASH相关纤维化阶段的性能

显著纤维化（≥F2）：纳入12项研究，共15299例研究对象，CatBoost模型最优，AUROC 0.960（图5A）。

进展期纤维化（≥F3）：11项研究纳入，涉及10581例，FIB-12（基于ADORE）模型表现最好，AUROC 0.911（图5B）。

肝硬化（F4）：纳入6项研究，共7496例，SVM模型最优，AUROC 0.956（图5C）。

图5. 基于机器学习模型诊断不同肝纤维化分期的AUROC曲线下面积森林图

ML模型的亚组分析

地理区域：诊断MASH时，亚洲研究里LightGBM模型最优（AUROC 0.920），非亚洲研究中XGBoost模型表现最好（AUROC 0.923）；诊断纤维化时，非亚洲研究里CatBoost模型最优（AUROC 0.960）。

集成与非集成方法：集成方法中，LightGBM、CatBoost、FIB-12、RF这几个模型，分别在MASH、显著纤维化、进展期纤维化、肝硬化中表现最佳；非集成方法里，SVM模型在各个纤维化阶段，表现都比较稳定且有优势。

发表年份：2013-2022年期间，MASH诊断中GB模型最优，纤维化各个阶段都是SVM模型表现最好；2023-2025年，MASH诊断里LightGBM模型最优，显著纤维化、进展期纤维化、肝硬化，分别是CatBoost、FIB-12、LR模型表现最佳。

图5 | 骨髓（BM）与外周血（PT）样本中的单核细胞具有 distinct functions 并可预测免疫治疗效果

文章小结

读完这篇系统综述，真心觉得干货拉满！作者团队用Meta分析，专门对比了机器学习（ML）和深度学习（DL）在MASLD相关肝纤维化以及MASH诊断中的实际表现，实操下来发现LightGBM、CatBoost还有ResNet50这几个模型效果格外亮眼，AUROC最高能冲到0.96，实用性特别强。

方法上也不复杂，就是标准的系统检索加上数据合并，流程很规范，咱们要是想做非侵入性诊断相关的研究，直接复刻这几个模型就行，省心又靠谱，能少走不少弯路～

另外，要是有朋友想复刻这篇研究的同款数据，或者打算做类似的AI诊断模型Meta分析，却不知道怎么下手找数据、筛文献，还有做相关图表的，欢迎随时私信我，咱们一起交流探讨，互相避坑！

您的点赞是支撑我创作的动力，点个赞再走吧~

本文来自网友投稿或网络内容，如有侵犯您的权益请联系我们删除，联系邮箱：wyl860211@qq.com 。

IF13.0!恭喜南京大学医学院附属鼓楼医院李捷团队拿下《 J. Adv. Res.》!ML和DL诊断脂肪肝肝炎及纤维化,揭晓最佳模型!

最新文章

热门文章

随机文章

IF13.0!恭喜南京大学医学院附属鼓楼医院李捷团队拿下《 J. Adv. Res.》!ML和DL诊断脂肪肝肝炎及纤维化,揭晓最佳模型!

南京兼职丨5月5日南京兼职全职招聘信息精选

杭州废弃工厂、南京旧超市、武汉旧粮库:三个“反常识”盘活案例,让同行看傻了

最新文章

热门文章

随机文章