当前位置：首页>南京>南京医科大附一医院护理团队发表高分护理1区SCI! 应用机器学习和SHAP解释识别手术室护士中的高度共情疲劳: 一项多中心横断面研究

南京医科大附一医院护理团队发表高分护理1区SCI! 应用机器学习和SHAP解释识别手术室护士中的高度共情疲劳: 一项多中心横断面研究

2026-06-26 00:28:59

专注科研一对一全流程教学

咨询微信：wzp1670423539

2026年5月在SCI杂志《BMC Nursing》上发表题为《Machine learning and SHAP interpretation to identify high-level compassion fatigue among operating room nurses: a multicenter crosssectional study》的文章。本研究探讨了手术室护士的同情心疲劳情况，分析了其患病率及症状特征，并利用机器学习构建预测模型。调查中1,024名护士中有31.8%报告重度同情心疲劳，主要表现为继发性创伤应激。随机森林模型在识别疲劳方面表现最佳，AUC达到0.851。研究确定了抑郁、焦虑和睡眠质量等五个重要特征。结果为医疗管理者提供了改善护士福祉的依据，以促使及时干预。

吴老师解读

一

研究背景

1.1 同情心疲劳：手术室护士的隐形职业伤害

手术室护士长期处于高强度、高紧张、高情感负荷的工作环境中——长时间站立、精神高度集中、目睹患者术中危急情况、应对术后不良结局等，使其成为同情心疲劳的高风险人群。同情心疲劳是指助人工作者因长期暴露于他人的痛苦和创伤情境中，导致自身情感资源耗竭、同理心下降的状态，包括继发性创伤应激、职业倦怠和同情心满意度下降三个核心维度。同情心疲劳不仅严重损害护士个人身心健康（如焦虑、抑郁、睡眠障碍），还削弱护理队伍稳定性（增加离职意愿），并危及患者安全（如注意力不集中导致差错）。然而，当前关于手术室护士同情心疲劳的大规模多中心调查仍然有限，且缺乏有效的风险预测工具。

1.2 研究空白与机器学习的机会

传统研究多采用回归分析识别同情心疲劳的影响因素，但无法充分捕捉复杂因素间的非线性交互作用。机器学习方法（如随机森林、XGBoost）能够处理高维数据、自动捕捉非线性关系，并可通过SHAP方法增强模型可解释性——使“黑箱”变得透明。因此，利用机器学习构建手术室护士同情心疲劳的预测模型，不仅可提高预测准确性，还能揭示各风险因素的相对贡献大小，为个性化干预提供依据。

1.3 研究目的

本研究旨在：分析手术室护士同情心疲劳的患病率及症状特征，利用机器学习构建并比较五种预测模型的性能，并通过SHAP分析确定不同特征对模型的相对贡献。

二

研究方法

2.1 研究设计

采用多中心横断面研究设计，覆盖中国20个城市。

2.2 研究对象

纳入1,024名手术室护士。纳入标准：在职注册护士；在手术室工作≥1年；自愿参与。

2.3 测量工具

职业生活质量量表：评估同情心疲劳的三个维度——继发性创伤应激、职业倦怠、同情心满意度。

患者健康问卷-9项：评估抑郁症状。

广泛性焦虑障碍量表-7项：评估焦虑症状。

匹兹堡睡眠质量指数：评估睡眠质量。

2.4 统计与机器学习方法

LASSO回归：从众多候选变量中筛选关键预测因子（降维）。

五种预测模型：决策树、Logistic回归、随机森林、支持向量机、XGBoost。

模型性能评估：使用受试者工作特征曲线下面积（AUC）比较模型区分能力。

模型解释：采用SHAP方法可视化各特征对预测的贡献。

三

研究结果

3.1 同情心疲劳的患病率

1,024名手术室护士中：

重度同情心疲劳：326人（31.8%）

中度同情心疲劳：311人（30.4%）

无或轻度同情心疲劳：387人（37.8%）

超过六成（62.2%）的手术室护士存在中重度同情心疲劳，问题严重。

3.2 三个维度的症状特征

在同情心疲劳的三个维度中：

继发性创伤应激发生率最高：95.4%（几乎普遍存在）

低同情心满意度：61.3%

职业倦怠：35.0%

继发性创伤应激（即因间接接触患者创伤而产生的心理应激反应）是手术室护士最突出的问题，其发生率远高于职业倦怠。这一发现提示，手术室护士的同情心疲劳更多源于“目睹创伤”而非“工作倦怠”。

3.3 机器学习模型性能比较

五种模型的AUC（测试集）比较：

随机森林：AUC=0.851（95% CI: 0.795-0.907）——最佳

XGBoost：AUC=0.824（95% CI: 0.769-0.879）——次优

其余三种模型（决策树、Logistic回归、支持向量机）表现略逊

随机森林模型在所有模型中表现最佳，AUC=0.851，表明其能够较好地区分“高同情心疲劳”和“低同情心疲劳”的手术室护士。

3.4 SHAP特征重要性分析

随机森林和XGBoost两个SHAP图结果一致，贡献最大的五个特征依次为：

抑郁（患者健康问卷-9项得分）

焦虑（广泛性焦虑障碍量表-7项得分）

自我心理健康培训（是否接受过）

睡眠质量（匹兹堡睡眠质量指数得分）

工作年限

这一排序提示，在预测手术室护士同情心疲劳时，心理因素（抑郁、焦虑）比工作年限等结构性因素更为重要。接受过自我心理健康培训的护士，其同情心疲劳风险更低（说明培训具有保护作用）。

四

讨论

4.1 主要发现及其意义

本研究首次在多中心大样本中，结合传统调查与机器学习方法，系统评估了手术室护士同情心疲劳的患病率并构建了预测模型。核心结论如下：

第一，同情心疲劳在手术室护士中极为普遍（中重度占62.2%），其中继发性创伤应激是最突出的症状维度（95.4%）。这一比例远超既往研究，可能与COVID-19疫情期间的持续高压工作环境、手术室特有的创伤性情境暴露以及中国手术室护士的工作负荷有关。

第二，随机森林模型（AUC=0.851）可有效识别高危个体，优于传统Logistic回归。这证明了机器学习在护理职业健康预测中的应用价值——它能捕捉传统回归难以发现的非线性交互作用。

第三，抑郁、焦虑、缺乏心理健康培训、睡眠障碍和较长工作年限是同情心疲劳的五大核心预测因子。其中抑郁和焦虑的贡献最大，提示心理状态是同情心疲劳的上游驱动力。这一发现对干预设计具有直接指导意义——管理者应优先关注护士的心理健康状态，而非仅关注工作负荷。

4.2 临床与公共卫生意义

早期筛查：可使用该模型对手术室护士进行定期风险评估，识别高危个体。

分层干预：对抑郁和焦虑得分高的护士，应优先提供心理咨询和支持；对睡眠质量差者，提供睡眠管理干预；对缺乏心理健康培训者，将培训纳入常规继续教育。

组织支持：鉴于继发性创伤应激的高发生率（95.4%），医院应建立创伤应激疏导机制，如定期的巴林特小组、心理援助热线。

4.3 研究优势与局限性

优势：

多中心大样本（20个城市，1,024人），代表性好。

首次将机器学习应用于手术室护士同情心疲劳预测。

SHAP分析增强了模型的可解释性，便于临床转化。

局限性：

横断面设计，不能确定因果关系（如抑郁是同情心疲劳的原因还是结果）。

便利抽样，可能存在选择偏倚。

未纳入手术室特异性变量（如手术类型、日手术量、暴露于死亡事件的频率）。

4.4 未来研究方向

开展纵向研究，追踪同情心疲劳的动态变化及预测因子的因果方向。

将模型转化为临床决策支持工具（如简易评分卡），便于护理管理者使用。

开展干预研究，验证针对“抑郁、焦虑、睡眠”的综合干预方案对降低同情心疲劳的效果。

五

结论

本研究通过对中国20个城市1,024名手术室护士的多中心横断面调查，结合机器学习方法，得出以下结论：

手术室护士同情心疲劳问题严重：中重度者占62.2%，其中继发性创伤应激是最突出的症状维度，发生率高达95.4%。这提示干预应重点针对创伤应激，而非仅关注职业倦怠。

随机森林模型是最优预测模型：测试集AUC=0.851（95% CI: 0.795-0.907），优于XGBoost（AUC=0.824）及其他三种传统算法，证明机器学习在护理职业健康预测中的优越性。

五大核心预测因子：抑郁、焦虑、自我心理健康培训、睡眠质量和工作年限，对模型贡献最大。心理因素（抑郁、焦虑）的贡献强于结构性因素（工作年限），提示干预应优先从心理健康入手。

临床意义：医疗管理者应建立手术室护士同情心疲劳的定期筛查机制，对高风险者提供分层干预（心理咨询、睡眠管理、心理健康培训），并重视继发性创伤应激的预防与疏导，以保障护士队伍稳定性和患者安全。

如何快速学会开展这类研究

第一步：确定研究主题和目的

1.1 选择研究主题

背景阅读：阅读关于同情心疲劳、手术室护士、机器学习预测模型、SHAP解释等文献。您会发现：

手术室护士工作强度大、情感负荷重，同情心疲劳风险很高；

传统研究多用回归分析找影响因素，但回归有局限——假设线性关系，无法捕捉复杂交互；

机器学习（随机森林、XGBoost）能处理非线性，预测更准；

但机器学习是“黑箱”，需要SHAP“打开”它，让医生和管理者信任结果。

这就是研究空白：没有人用机器学习方法预测手术室护士的同情心疲劳，也没有人用SHAP解释过哪些因素最重要。

1.2 明确研究目的

确定目标：

调查手术室护士同情心疲劳的患病率及症状特征（三个维度的分布）。

用5种机器学习算法构建预测模型，找出最优算法。

用SHAP分析揭示各特征对预测的贡献大小。

小白提示：这类研究的最大亮点是“传统调查+机器学习+SHAP解释”的组合拳。你不需要自己发明算法——随机森林、XGBoost都有现成的R/Python包。SHAP也有现成的库。你需要做的只是收集数据、清洗数据、跑模型、读结果。

二

研究方法

2.1 选择研究类型

多中心横断面研究设计：

在单一时间点通过问卷收集所有数据。

特点：可快速获取大样本（1024人，20个城市），但不能确定因果关系。

2.2 确定研究参与者

样本选择：采用便利抽样法，从中国20个城市招募手术室护士。

纳入标准：在职注册护士；手术室工作≥1年；自愿参与。

样本量要求：机器学习通常要求样本量至少为特征数的10-20倍。本研究1024人，足够。

小白操作：通过各医院护理部或手术室护士长发放问卷链接，注意伦理审批和知情同意。

2.3 变量的选择与测量

结局变量（Y）：同情心疲劳（根据职业生活质量量表分为“高/低”两组，用于分类预测）。

候选预测因子（X）：人口学变量、抑郁（PHQ-9）、焦虑（GAD-7）、睡眠质量（PSQI）、心理健康培训经历等。

协变量：年龄、性别、职称、工作年限等。

2.4 分析框架

描述性统计：同情心疲劳的患病率及各维度特征。

LASSO回归：从几十个候选变量中筛选关键预测因子（降维）。

5种机器学习模型：决策树、Logistic回归、随机森林、SVM、XGBoost——分别训练、比较AUC。

SHAP分析：解释最优模型的预测机制（特征重要性排序）。

第三步：数据获取与整理

3.1 数据获取

数据集：不依赖公开数据库，通过在线问卷收集一手数据。于2025年某时间段，通过20个城市的医院护理部发放问卷链接。

小白操作：设计问卷时，将多个量表组合在一起，设置必填。通过预调查测试信效度（Cronbach‘s α > 0.7）。

3.2 数据整理

清理数据：

剔除填写时间过短、规律作答、关键变量缺失的无效问卷。

有效问卷1024份。

变量生成：

计算同情心疲劳总分，按标准分为“高/低”二分类（结局变量）。

计算抑郁总分、焦虑总分、睡眠质量总分（连续变量）。

对分类变量（如性别、职称、有无心理健康培训）进行编码。

数据分割：将数据随机分为训练集（70%）和测试集（30%），用于模型训练和验证。

最终生成R数据集： 1024行，列包括：结局变量（高/低疲劳）、候选预测因子、协变量。

第四步：数据分析

4.1 描述性分析

计算同情心疲劳的患病率（重度31.8%，中度30.4%，合计62.2%）。计算三个维度的发生率——继发性创伤应激（95.4%）、低同情心满意度（61.3%）、职业倦怠（35.0%）。

4.2 LASSO回归——特征筛选

定义： LASSO（最小绝对收缩和选择算子）是一种带L1惩罚的回归方法，能将不重要的变量系数压缩为0，实现自动变量选择。它在机器学习建模前使用，可以减少特征数量、防止过拟合。

本研究的应用：从所有候选变量中筛选出与同情心疲劳最相关的关键预测因子。

4.3 五种机器学习模型

简介（小白版）：

Logistic回归：传统基准模型，假设线性关系。

决策树：用“如果…那么…”规则做分类，直观但容易过拟合。

随机森林：多棵决策树“投票”决定结果，比单棵树更稳更准。

支持向量机（SVM）：找一条“最宽的分界线”分隔两类。

XGBoost：梯度提升树的升级版，逐棵树纠正前一棵的错误。

操作（R的caret或Python的scikit-learn）：

用训练集分别训练5种模型。

在测试集上预测，计算每个模型的AUC。

比较AUC，选出最优模型。

结果：随机森林AUC=0.851，XGBoost AUC=0.824，其余更低 → 随机森林赢了。

4.4 模型评估指标——AUC

定义： AUC（受试者工作特征曲线下面积）衡量模型区分“高疲劳”和“低疲劳”的能力。AUC>0.7为可接受，>0.8为良好，>0.9为优秀。

本研究的应用：随机森林AUC=0.851（良好），说明模型能较好地区分高危和低危护士。

4.5 SHAP分析——模型解释

定义： SHapley Additive exPlanations——一种解释机器学习模型预测的方法，量化每个特征对预测结果的贡献大小和方向。它把模型的“黑箱”打开一条缝，告诉你“为什么这个护士被判为高风险”。

本研究的应用：两个SHAP图（随机森林和XGBoost）结果一致，贡献最大的5个特征：

抑郁（PHQ-9得分）——贡献最大

焦虑（GAD-7得分）

自我心理健康培训（有无）

睡眠质量（PSQI得分）

工作年限

小白理解： SHAP告诉你“这个护士被判为高危，主要是因为她的抑郁得分高、焦虑得分高、睡眠差”——这让模型结果在临床上可信、可用。

第五步：结果解读

5.1 主要结果

中重度同情心疲劳占62.2%（重度31.8%+中度30.4%）。

继发性创伤应激发生率最高（95.4%）。

随机森林模型最优（AUC=0.851）。

五大核心特征：抑郁、焦虑、心理健康培训、睡眠质量、工作年限。

5.2 统计显著性

AUC的95% CI不包含0.5 → 模型有效。

SHAP值比较 → 特征重要性排序。

5.3 临床/管理意义

管理者应重点筛查抑郁、焦虑、睡眠差的护士。

提供心理健康培训可降低同情心疲劳风险。

5.4 局限性

横断面不能因果；便利抽样外推有限；未纳入手术室特异性变量。

第六步：讨论与结论

6.1 讨论框架（5段式）

总结：同情心疲劳患病率高，继发性创伤应激最突出；随机森林预测最佳；SHAP揭示抑郁焦虑是关键。

与文献比较：首次在手术室护士中用机器学习+SHAP。

机制：目睹创伤→继发性创伤应激→同情心疲劳；抑郁焦虑放大效应。

实践：定期筛查抑郁焦虑睡眠；提供心理健康培训；建立创伤应激疏导机制。

局限与未来：纵向研究、干预验证、手术室特异性变量。

6.2 结论

“手术室护士同情心疲劳中重度占62.2%，继发性创伤应激最高（95.4%）。随机森林模型（AUC=0.851）可有效预测高危个体。抑郁、焦虑、睡眠质量和心理健康培训是关键干预靶点。”

第七步：撰写与发布

7.1 撰写报告

遵循STROBE声明（横断面研究）。

标题建议： “Prevalence and machine learning-based prediction of compassion fatigue among operating room nurses: a multicenter cross-sectional study”

方法关键点：

报告LASSO回归的λ选择方法（交叉验证）。

报告5种机器学习模型的超参数设置。

报告数据分割方法（训练/测试比例）。

报告SHAP分析的具体实现。

结果：

表1：基线特征。

表2：同情心疲劳患病率及维度分布。

表3：5种模型性能比较（AUC及95% CI）。

图1：SHAP特征重要性图（条形图或蜂群图）。

7.2 投稿前自查清单

是否报告了伦理批准号和知情同意？

是否报告了各量表的信效度（Cronbach‘s α）？

是否报告了LASSO的交叉验证方法？

是否报告了数据分割的随机种子？

是否报告了各模型的超参数设置？

是否报告了AUC的95%置信区间？

是否提供了SHAP图？

7.3 推荐期刊

Journal of Nursing Management

International Journal of Nursing Studies

BMC Nursing

Frontiers in Public Health

给小白的总体时间表（8-12个月）

统计学知识点解读

研究设计

1.1 多中心横断面研究设计

定义：横断面研究是指在特定时间点上，对样本群体进行数据收集，以评估不同变量间的关系。本研究采用多中心横断面设计，于2025年期间，通过在线问卷同时收集中国20个城市手术室护士的同情心疲劳、抑郁、焦虑、睡眠质量及人口学、工作特征等数据。

特点：

现状描述：适合估计手术室护士同情心疲劳的患病率（62.2%中重度）及各维度特征（继发性创伤应激95.4%）。

预测模型开发：能够基于横断面数据构建分类模型，识别高同情心疲劳风险个体，但无法确定因果关系。

1.2 便利抽样

定义：便利抽样是一种非概率抽样方法，研究者选择最容易接触到的研究对象。本研究通过20个城市的医院护理部发放问卷链接，选择自愿参与的手术室护士。

特点：操作简便，成本低，可快速获取大样本（1024人），但样本代表性有限，外推需谨慎。

1.3 数据分割（训练集与测试集）

定义：将数据随机分为两部分：训练集（70%）用于构建模型，测试集（30%）用于评估模型性能。这样可以避免“用同一批数据既训练又考试”的过拟合问题。

本研究的应用： 1024人随机分为训练集（约717人）和测试集（约307人），在训练集上训练模型，在测试集上计算AUC。

小白理解：就像用一部分题目让学生学习，再用另一部分题目考试——这样才能真正检验学生学会了多少。

变量的选择与测量

2.1 结局变量（因变量）：同情心疲劳（二分类）

定义：根据职业生活质量量表得分，将护士分为“高同情心疲劳”和“低同情心疲劳”两组。在机器学习中，这就是模型要“预测”的目标。

2.2 候选预测因子（自变量）

定义：可能影响同情心疲劳的各种因素，包括：

人口学变量：年龄、性别、职称、工作年限

心理变量：抑郁（PHQ-9得分）、焦虑（GAD-7得分）

行为变量：睡眠质量（PSQI得分）

经历变量：是否接受过自我心理健康培训

2.3 特征筛选（LASSO回归）

定义： LASSO（最小绝对收缩和选择算子）是一种带L1惩罚的回归方法，能将不重要的变量系数压缩为0，实现自动变量选择。在机器学习建模前使用，可以减少特征数量、防止过拟合。

本研究的应用：从所有候选变量中筛选出与同情心疲劳最相关的关键预测因子，减少模型输入的变量数。

小白理解：就像从一堆杂物里挑出真正有用的几件——LASSO自动帮你扔掉没用的东西。

数据分析方法

3.1 决策树

定义：一种用“如果…那么…”规则做分类的树状模型。它通过不断分裂数据，形成一系列决策规则，最终将样本归入某一类别。

优点：直观易懂，可视化强。缺点：容易过拟合（在训练集上表现好，在新数据上差）。

小白理解：就像玩“20个问题”游戏——通过一系列“是/否”问题猜出答案。

3.2 Logistic回归

定义：传统统计方法，用于分析多个自变量与一个二分类因变量的关系，输出风险概率。它是“基准模型”，用于衡量机器学习算法是否真的更好。

优点：可解释性强，系数直接反映影响方向。缺点：假设线性关系，无法捕捉复杂交互。

小白理解：算OR的那套方法，相当于“常规武器”。

3.3 随机森林（本研究最佳模型）

定义：一种集成学习方法——构建多棵决策树，每棵树用随机样本和随机特征子集训练，最终通过“投票”决定结果。它比单棵决策树更稳、更准。

优点： ①能处理非线性；②自动捕捉特征交互；③不易过拟合。缺点：可解释性较差（黑箱）。

本研究的应用：在五种模型中AUC最高（0.851），成为最优模型。

小白理解：就像“众人拾柴火焰高”——很多棵决策树一起“投票”，比一棵树更可靠。

3.4 支持向量机

定义：一种通过寻找“最宽的分界线”（最优超平面）将两类样本分开的算法。适合高维数据。

优点：在小样本高维数据中表现好。缺点：对参数敏感，大数据集训练慢。

3.5 XGBoost

定义： “极端梯度提升”——一种集成学习方法，通过反复构建决策树，每棵新树专门纠正前一棵树的错误。它是数据科学竞赛的常胜将军。

优点：性能强，速度快。缺点：参数多，调优复杂。

本研究的应用： AUC=0.824，仅次于随机森林。

小白理解：就像“纠错机制”——后面的人专门改前面人的错误，越改越准。

3.6 五种模型的本质区别

模型评估指标

4.1 受试者工作特征曲线与曲线下面积（ROC & AUC）

定义： ROC曲线以假阳性率为横坐标、真阳性率为纵坐标，用于评估模型区分“高同情心疲劳”和“低同情心疲劳”的能力。AUC是曲线下面积，范围0.5-1.0：0.5为随机猜测，0.7-0.8为可接受，0.8-0.9为良好，>0.9为优秀。

本研究的应用：

随机森林AUC=0.851（95% CI: 0.795-0.907）→ 模型良好

XGBoost AUC=0.824（95% CI: 0.769-0.879）→ 良好

其他模型略低

小白理解：随机抽一个高疲劳者和一个低疲劳者，模型有85.1%的概率给前者打出更高风险。

4.2 AUC的95%置信区间

定义：表示AUC估计的精度。若区间不包含0.5，则模型优于随机猜测。

本研究的应用：随机森林AUC的95% CI为0.795-0.907，全部>0.5，显著优于随机猜测。

模型解释方法

5.1 SHAP分析

定义： SHapley Additive exPlanations——一种基于博弈论的解释方法，量化每个特征对每个样本预测结果的贡献大小和方向。它让“黑箱”模型变得可解释。

本研究的应用：两个SHAP图（随机森林和XGBoost）结果一致，贡献最大的五个特征依次为：抑郁、焦虑、自我心理健康培训、睡眠质量、工作年限。

小白理解： SHAP告诉你“这个护士被判为高危，主要是因为她的抑郁得分高、焦虑得分高、睡眠差”——这让预测结果在临床上可信、可用。

5.2 特征重要性排序

定义：各特征对模型预测贡献的排名。SHAP值的平均绝对值越大，特征越重要。

本研究的发现：抑郁和焦虑排前两名，说明心理因素是同情心疲劳的最强预测因子。

祝大家发文顺利，有什么不懂可以在评论区留言，吴老师尽量解答！零基础的同学可以咨询一对一辅导，快速发表SCI文章！

吴老师微信：wzp1670423539

还在担心没有SCI论文，缺少竞争力？找专人学习、快速发表人生第一篇SCI，点⬇️链接报名咨询！

0基础发护理SCI！一对一全程教学指导（教到发表模式）招生报名！

护研SCI专注护士SCI论文一对一指导，让每个护士都学会从０到１发表SCI！

我们定期解读优质文献，分享文章的具体思路和方法学。此外，我们面向护士提供高端一对一科研线上辅导，让零基础的普通人快速学会从0到1发表临床科研SCI论文。

感兴趣请扫描文末吴老师的二维码具体咨询如何加入SCI论文辅导项目。微信：wzp1670423539

本期编辑

你的分享、点赞、在看

我都喜欢

授人以鱼不如授人以渔

学无止境，终身学习！

本文来自网友投稿或网络内容，如有侵犯您的权益请联系我们删除，联系邮箱：wyl860211@qq.com 。

南京医科大附一医院护理团队发表高分护理1区SCI! 应用机器学习和SHAP解释识别手术室护士中的高度共情疲劳: 一项多中心横断面研究

最新文章

热门文章

随机文章

南京医科大附一医院护理团队发表高分护理1区SCI! 应用机器学习和SHAP解释识别手术室护士中的高度共情疲劳: 一项多中心横断面研究

荐读|南京大学陈昌凯老师毕业致辞出圈

南京六合丨160万119平精装3室 近地铁

最新文章

热门文章

随机文章

南京六合丨160万119平精装3室近地铁