91学术服务平台

您好,欢迎来到91学术官网!站长邮箱:91xszz@sina.com

发布论文

论文咨询

梯度提升决策树算法解释模型预测外伤性硬脑膜外血肿患者肺部感染

  2025-06-18    43  上传者:管理员

摘要:目的探索基于梯度提升决策树(GradientBoostingDecisionTree,GBDT)和SHAP解释模型在预测神经外科外伤性硬脑膜外血肿患者肺部感染(LC)中的应用,旨在提高肺部感染预测准确性并为临床决策提供数据支撑。方法采用回顾性队列研究设计,连续纳入2021年1月—2022年12月本院神经外科重症监护室收治的139例外伤性硬脑膜外血肿患者,依据是否出现肺部感染分为肺部感染组(LC组,24例)和无肺部感染组(NLC组,115例)两组。采用单因素及多变量Logistic回归分析影响肺部感染的危险因素,构建logistics回归算法模型(PLogistics);应用GBDT和SHAP解释模型构建神经外科外伤性硬脑膜外血肿患者肺部感染预测模型(PG-Boost),应用ROC曲线评估、比较两种模型的预测性能。结果基于单因素研究结果显示:二元logistics回归分析确定了5个主要危险因素(住院天数≥14d、机械通气、ICU初始GCS评分≤8分、合并COPD和口腔致病微生物感染),其中口腔致病微生物感染风险最高(OR=6.38,95%CI:2.28~17.84,P<0.001)。基于上述单因素构建的GBDT-SHAP预测模型显示,住院天数≥14d具有最高的相对重要性(28.45%),其次是机械通气(25.67%)和ICU初始GCS评分≤8分(20.12%)。ROC曲线分析表明,GBDT模型(AUC=0.915,95%CI:0.835~0.995)较传统logistics回归模型(AUC=0.848,95%CI:0.742~0.954)具有更优的预测效能,其敏感性(0.875vs0.750)和特异性(0.957vs0.948)均较高。结论基于G-Boost算法的SHAP解释预测模型具有较高的准确性和临床实用价值,可为神经外科外伤性硬脑膜外血肿患者肺部感染的早期预防提供决策支持。

  • 关键词:
  • 机器学习
  • 梯度提升决策树算法
  • 神经外科
  • 肺部感染
  • 重症
  • 预测模型
  • 加入收藏

外伤性硬脑膜外血肿(TraumaticBrainInjury,TBI)是颅脑创伤后硬脑膜与颅骨内板之间的出血积聚,常因颞动脉或静脉窦损伤所致。其病理生理特点包括颅内压升高导致的脑组织受压、继发性炎症反应激活、血脑屏障功能受损、神经免疫功能紊乱等[1]。全球范围内,TBI的发病率不断升高,是导致死亡和致残的重要原因之一[2]。TBI患者意识障碍增加误吸风险、免疫功能抑制降低抗感染能力,显著增加患者的病死率与医疗成本,早期预测对改善预后至关重要。现有的预测模型针对这一并发症的研究较少,传统预测方法未能充分整合多维度临床指标,现有模型对患者个体差异考虑不足,预测结果缺乏生物学解释依据,临床实用性有待提高[3]。梯度提升决策树(GradientBoostingDecisionTree,GBDT)算法具有处理非线性关系的优势[4,5],SHAP框架提供可靠的解释方法,因此,构建基于GBDT-SHAP框架的预测-解释模型,可实现精准预测感染风险、识别关键预测因子,阐明预测机制,指导临床防治[6,7]。为了更好地预测外伤性硬脑膜外血肿患者术后发生肺部感染的风险,本研究提出应用GBDT结合SHAP解释技术,旨在建立一个预测-解释-指导一体化模式、高精确度和可解释性强的预测模型。这一研究不但有望为临床诊治提供数据支持,还可能为相关临床决策提供理论依据。


一、材料与方法


1.研究对象:

回顾性纳入2021年1—2022年12月本院收治的139例外伤性硬脑膜外血肿患者。诊断标准:符合外伤性硬脑膜外血肿临床标准,经颅脑MRI提示存在位于颅骨内板和脑表面之间血肿影像指征;年龄≥18岁;病案首页符合ICD-10编码中外伤性硬脑膜外血肿第一诊断S06.4范畴[8];未接受免疫抑制治疗;能够提供完整医疗记录和同意书;没有活动性肺部感染;未参与其他临床试验。排除标准:既往有慢性呼吸系统疾病;严重心脏、肝脏或肾脏功能不全;中枢神经系统感染;急性期另有肝、肾等器质性炎性感染;对研究中使用药物过敏;受孕或哺乳期妇女;精神病史影响服从性。依据是否出现肺部感染分为肺部感染组(LC组)和无肺部感染组(NLC组),两组间的基线特征资料见表1。所有研究遵循«赫尔基松宣言»伦理框架,已经过河南省郑州市第三人民医院伦理委员会审查批准(审批件号:2025-04-015-K01)。

2.方法:

(1)人口学信息及临床基线资料搜集:本研究采用回顾性队列研究设计,连续纳入2020年1月—2022年12月本院神经外科接受治疗的外伤性硬脑膜外血肿患者。通过电子病历系统收集以下数据:①人口学特征:年龄、性别、BMI;②临床过程指标:入院时GCS评分、住院天数:③治疗措施:机械通气使用情况、气管切开、留置胃管情况;④合并症:COPD、糖尿病;⑤实验室检查:a.CRP:采用免疫比浊法,入院24h内测定;b.血红蛋白:采用自动血细胞分析仪测定;c.白细胞计数:采用流式细胞术检测;d.口腔微生物培养:72h标准培养方法鉴定致病菌。(2)肺部感染事件定义:符合下列标准中的至少2项即可诊断为肺部感染:新发肺部浸润影;体温>38.3℃或<36℃;白细胞计数>12×109/L或<4×109/L;新发化脓性痰液;血氧饱和度下降或需要增加吸氧浓度;

3.GBDT算法的SHAP解释模型构建方法:

应用Python3.8和scikit-learn0.24.2进行数据预处理,对连续变量进行标准化处理(StandardScaler),计算每个特征的均值(μ)和标准差(σ),转换公式:X_new=(x-μ)/σ,确保所有连续变量在相同尺度上;对分类变量进行独热编码(One-hotencoding),drop='first'选项删除第一个类别,避免共线性sparse=False输出密集矩阵;随机打乱数据(shuffle=True),固定随机种子(randomstate=42)确保可重复性,在每个折叠中分别进行预处理,避免数据泄露自动处理缺失值,采用5折交叉验证评估模型性能。使用Light-GBM框架(版本3.3.2)实现GBDT算法,主要超参数设置为“'objective':'binary','metric':'auc','learning_rate':0.01,'num_leaves':31,'max_depth':6,'min_data_in_leaf':20,'feature_fraction':0.8,'bagging_fraction':0.8,'bagging_freq':5”,对每个样本计算特征贡献度,生成局部解释性矩阵,计算特征间的交互效应,生成特征重要性排序,分析特征对预测的影响方向,识别关键预测因素。本研究的所有统计分析和机器学习模型构建使用Python实现,显著性水平设为α=0.05,采用双侧检验。所有代码和数据分析流程已在GitHub开源平台公开。

4.统计学处理:

所有统计分析均应用R软件4.1.0版本(RFoundationforStatisticalComputing,Vienna,Austria)和SPSS26.0软件(IBMCorp.,Armonk,NY)完成。数据分布检验:应用Shapiro-Wilk检验评估连续变量的正态分布,正态分布数据以(x±s)表示;非正态分布数据以[M50(IQR25,IQR75)]表示;分类变量以频数(百分比)[n(%)]表示;正态分布连续变量:采用独立样本t检验;非正态分布连续变量:采用Mann-WhitneyU检验;分类变量:采用χ2检验或Fisher精确检验。计算效应值,连续变量采用Cohen'sd及其95%置信区间;分类变量采用比值比(OR)及其95%置信区间。采用单因素及多变量Logistic回归分析影响肺部感染的危险因素,构建logistics回归算法模型(PLogistics);应用GBDT和SHAP解释模型构建神经外科外伤性硬脑膜外血肿患者肺部感染预测模型(PG-Boost)[9]。采用二元Logistic回归分析,纳入单因素分析中P<0.05的变量,采用Forward逐步回归法筛选变量,报告β系数、标准误(SE)、Wald值、OR值(95%CI)及P值。G-Boost预测模型评估采用ROC曲线分析,计算AUC值及其95%置信区间,模型校准采用Hosmer-Lemeshow检验,计算模型敏感度、特异度,DeLong检验AUC值。Bootstrap法重复抽样1000次,计算乐观度校正后的C统计量;评估模型稳定性计算各参数的95%置信区间,缺失值处理,记录缺失值比例。采用多重插补法处理缺失数据,敏感性分析评估缺失值影响。双侧检验P<0.05认为差异具有统计学意义。


二、结果


1.一般资料特征及单因素分析:

139例神经外科外伤性硬脑膜外血肿患者中24例发生了肺部感染,整体感染率为17.27%。单因素分析显示,住院天数、机械通气、ICU初始GCS评分、合并COPD、气管切开、入院初始IgG水平、BMI、口腔致病微生物感染、血红蛋白水平是神经外科外伤性硬脑膜外血肿患者肺部感染的主要因素(P<0.05)。见表1。

2.神经外科外伤性硬脑膜外血肿患者肺部感染二元多因素logistics回归分析:

以患者是否发生肺部感染作为因变量,将单因素分析危险因素(P<0.05)指标作为自变量纳入二元多因素logistics回归分析,其中:定性变量赋值规则为“有=1,无=0”,住院天数≥14d记作“1”,ICU初始GCS评分≤8分,记作“1”。二元多因素logistics回归分析结果提示,住院天数(≥14d)、机械通气、ICU初始GCS评分≤8分、合并COPD、口腔致病微生物感染是神经外科外伤性硬脑膜外血肿患者肺部感染的主要危险因素(P<0.05)。预测概率P=e^Logit(P)/(1+e^Logit(P)),预测方程:Logit(Plogistics)=-2.147+0.182×住院天数+0.986×机械通气-0.425×GCS评分+1.324×COPD+1.853×口腔感染。见表2。

3.基于GBDT算法SHAP解释模型构建神经外科外伤性硬脑膜外血肿患者肺部感染预测模型:

使用GBDT机器学习算法构建预测模型,并结合SHAP(SHapleyAdditiveexPlanations)值解释模型预测结果,在模型训练过程中,设置决策树数量为100,学习率为0.1,树的最大深度为3。模型中纳入5个预测变量:住院天数(≥14d)、机械通气、ICU初始GCS评分(≤8分)、合并COPD和口腔致病微生物感染,logit(PG-Boost)=-2.345+0.324×住院天数+0.289×机械通气+0.256×ICU初始GCS评分+0.198×合并COPD+0.167×口腔致病微生物感染。结果见表3。

4.PLogistics与PG-Boost预测神经外科外伤性硬脑膜外血肿患者肺部感染效能ROC分析:

经ROC曲线分析显示,PLogistics、PG-Boost模型的AUC及95%CI、敏感性、特异性、约登指数、完美指数分别为0.848(0.742~0.954)、0.915(0.835~0.995)、0.750、0.875、0.948、0.957、0.698、0.832、0.255、0.994。ROC预测模型参数显示,PG-Boost模型效能显著高于PLogistics模型。如表4、如图1。

表1神经外科外伤性硬脑膜外血肿患者肺部感染基线信息及临床特征单因素分析

表2神经外科外伤性硬脑膜外血肿患者肺部感染二元多因素logistics回归分析

表3GBDT算法SHAP解释模型构建神经外科外伤性硬脑膜外血肿患者肺部感染预测模型

表4PLogistics与PG-Boost预测神经外科外伤性硬脑膜外血肿患者肺部感染效能ROC分析参数

图1PLogistics与PG-Boost预测神经外科外伤性硬脑膜外血肿患者肺部感染效能ROC曲线图


三、讨论


神经外科外伤性硬脑膜外血肿患者通常表现为意识障碍、瞳孔改变、偏瘫、呕吐及局灶性神经功能缺损等症状,随着病情进展,患者可能出现脑疝、呼吸循环功能障碍等危及生命的并发症[10]。患者往往因意识水平下降、吞咽功能受损,极易发生误吸,加之长期卧床、免疫功能抑制等因素,神经外科外伤性硬脑膜外血肿患者的肺部感染问题一直是临床治疗中的重大挑战[11]。研究表明,这类患者发生肺部感染不仅显著增加病死率达30%~50%,还会导致ICU住院时间延长7~14d,每例患者额外增加医疗支出约5~8万元[12]。肺部感染会加重患者的脑水肿状况,对神经功能的恢复造成不利影响,且增加抗生素耐药菌株产生风险[13,14]。目前的治疗方案主要包括预防性抗生素使用、及时气管插管、物理降温、营养支持和俯卧位通气等措施。然而,目前临床实践中,预防性抗生素的使用往往缺乏精确的量化指标支持,主要依赖医生的经验判断。这种情况容易导致抗生素使用的盲目性,一方面可能造成不必要的过度用药,增加耐药性风险;另一方面也可能出现用药时机把握不当,影响预防效果[15]。特别是在危重症患者中,由于病情复杂多变,单纯依靠传统经验难以准确判断用药时机和用药方案。流行病学研究数据显示,神经外科外伤性硬脑膜外血肿患者的肺部感染发病率约为35%~45%,在重症患者中这一比例更是高达60%~70%,且呈现逐年上升趋势[16],缺乏标准化的风险分层体系,难以实现精准的预防干预;监测指标体系不够完善,影响早期预警效果;治疗效果评价缺乏统一标准,难以进行客观评估;临床数据的收集和分析不够系统,制约了循证医学研究的开展。

在此背景下,本研究构建基于GBDT算法的SHAP解释模型,不仅能够实现对高危人群的早期识别,还可以为制定个体化预防方案提供科学依据,有助于优化医疗资源配置,降低医疗成本。通过机器学习算法对复杂临床数据的分析,能够提供更精确的预测结果,为临床决策提供可靠的参考依据,最终提高治疗效果。神经外科外伤性硬脑膜外血肿患者发生肺部感染涉及多个病理生理过程,包括意识状态改变、吞咽功能障碍、免疫功能抑制等;传统评估方法往往局限于单一指标或经验判断,难以全面把握这些复杂的病理变化过程;SHAP预测模型能够通过整合多维度的临床指标,更好地反映疾病发展的动态变化规律。现代医疗实践产生了包括实验室检查、影像学特征、生命体征监测等多模态信息的海量临床数据。这些数据之间存在复杂的非线性关系,传统统计方法难以充分挖掘其中的规律。GBDT算法具有强大的特征学习能力,可以自动识别关键预测因素,并通过迭代优化不断提高预测准确性。而SHAP解释模型的引入,则为算法的“黑箱”决策提供了可解释性,使临床医生能够理解模型的预测依据。在算法层面,该模型采用了先进的集成学习方法。GBDT通过构建多个弱学习器并将其组合成强学习器,能够有效处理临床数据中普遍存在的类别不平衡、缺失值等问题;SHAP值的计算基于博弈论的数学基础,可以准确量化每个特征对预测结果的贡献度,为临床决策提供了更可靠的理论支持[17]。基于人工智能的预测模型代表了现代医学向精准化、个体化方向发展的重要趋势。本研究基于GBDT算法构建SHAP解释模型,对神经外科外伤性硬脑膜外血肿患者肺部感染的风险因素进行预测分析。研究结果不仅验证了传统危险因素的重要性,更揭示了机器学习方法在临床预测中的优越性。模型的优化过程充分考虑了医疗实践的特殊性,通过交叉验证等技术手段,确保模型在不同患者群体中都具有稳定的预测效能。

本研究通过二元多因素logistics回归分析和GBDT算法SHAP解释模型,深入探讨了神经外科外伤性硬脑膜外血肿患者肺部感染的危险因素及其预测模型,研究结果具有重要的临床指导意义。从病理生理机制来看,延长住院时间(≥14d)增加了患者院内感染的风险,这与长期卧床导致的肺部通气功能下降、呼吸道防御功能减弱密切相关[18]。机械通气作为重要危险因素[19],其机制在于气管插管破坏了上呼吸道的自然屏障,同时呼吸机相关性肺损伤(VILI)可能加重肺部炎症反应[20]。ICU初始GCS评分≤8分的患者往往伴随意识障碍,咳嗽反射和吞咽功能减弱,增加了误吸的风险。这类患者常需要长期卧床,进一步加重了肺部感染的风险。合并COPD的患者本身存在气道高反应性和慢性炎症状态,加之呼吸道纤毛清除功能受损,显著增加了感染风险[21],与王瑞方等[22]研究结论基本一致。口腔致病微生物感染则直接为肺部感染提供了病原体来源,特别是在意识障碍患者中,口腔分泌物误吸更容易诱发肺部感染[23,24]。本研究创新性地采用GBDT算法构建SHAP解释模型,相比传统logistics回归分析具有明显优势。从ROC曲线分析结果可见,PG-Boost模型的AUC值(0.915)显著高于PLogistics模型(0.848),预测效能更优,这可能与GBDT算法能够更好地处理非线性关系,并通过迭代方式不断优化预测准确性有关。

SHAP解释模型的相对重要性分析显示,住院天数(28.45%)和机械通气(25.67%)是最主要的预测因素,这与临床实际相符。该模型不仅提供了更准确的预测结果,还实现了对预测结果的可解释性,为临床医生制定个体化预防方案提供了重要参考。

本研究的创新之处在于将GBDT算法与SHAP解释框架相结合用于神经外科感染预测。相比传统logistics回归(AUC=0.848),该模型展现出更优的预测效能(AUC=0.915)。SHAP框架提供了模型决策的可解释性,使临床医生能够理解预测背后的具体依据。模型较高的敏感性(0.875)和特异性(0.957)表明其在临床筛查中具有实用价值,特别是对于高危患者的早期识别,可以指导预防性干预措施实施。

研究的主要局限包括:样本量相对有限,可能影响模型的泛化能力;未考虑时间序列特征,难以反映动态变化;缺乏外部验证数据集。未来研究方向将集中于扩大样本量并进行多中心验证、整合时序数据构建动态预测模型、开发基于该模型的临床决策支持系统。

综上所述,本研究通过机器学习方法揭示了神经外科外伤性硬脑膜外血肿患者肺部感染的关键危险因素,并建立了具有较高预测效能的模型,对于早期识别高危患者、及时采取预防措施具有重要的临床应用价值。


参考文献:

[3]季晶.浅谈颅脑外伤精准诊疗与分子标志物[J].临床神经外科杂志,2024,21(4):361-364,370.

[4]徐瑞,肖海军,胡琛.基于WGBDT的心衰患者半年内再入院风险预测[J].中南民族大学学报(自然科学版),2023,42(3):425-432.

[6]柯国霖.梯度提升决策树(GBDT)并行学习算法研究[D].厦门:厦门大学,2016.

[8]张娜,马志晖.外伤性颅内血肿的编码分析[J].中国病案,2019,20(6):21-23.


基金资助:河南省医学科技攻关计划(LHGJ20200723);


文章来源:刘德总.梯度提升决策树算法解释模型预测外伤性硬脑膜外血肿患者肺部感染[J].齐齐哈尔医学院学报,2025,46(11):1042-1047.

分享:

91学术论文范文

相关论文

推荐期刊

网友评论

加载更多

我要评论

齐齐哈尔医学院学报

期刊名称:齐齐哈尔医学院学报

期刊人气:4280

期刊详情

主管单位:黑龙江教育厅

主办单位:齐齐哈尔医学院

出版地方:黑龙江

专业分类:医学

国际刊号:1002-1256

国内刊号:23-1278/R

邮发代号:14-257

创刊时间:1984年

发行周期:双月刊

期刊开本:大16开

见刊时间:4-6个月

论文导航

查看更多

相关期刊

热门论文

【91学术】(www.91xueshu.com)属于综合性学术交流平台,信息来自源互联网共享,如有版权协议请告知删除,ICP备案:冀ICP备19018493号

微信咨询

返回顶部

发布论文

上传文件

发布论文

上传文件

发布论文

您的论文已提交,我们会尽快联系您,请耐心等待!

知 道 了

登录

点击换一张
点击换一张
已经有账号?立即登录
已经有账号?立即登录

找回密码

找回密码

你的密码已发送到您的邮箱,请查看!

确 定