首页 > 论文范文 > 医药卫生论文 > 临床医学论文 > 抑郁症论文 > 机器学习构建中重度抑郁症住院患者使用SNRI类抗抑郁药的疗效预测模型

机器学习构建中重度抑郁症住院患者使用SNRI类抗抑郁药的疗效预测模型

2025-08-16 38 上传者：管理员

摘要：目的运用机器学习方法构建中重度抑郁症住院患者使用5-羟色胺去甲肾上腺素再摄取抑制剂（SNRI）的疗效预测模型。方法回顾性收集2022年1月至2024年10月在新疆某三甲医院使用SNRI类药物治疗的中重度抑郁症住院患者病历资料，根据24项汉密尔顿抑郁量表评分标准的减分率，将患者分为有效组与无效组；经过LASSO回归筛选与SNRI类药物疗效相关的特征变量，应用训练集构建支持向量机、k近邻、随机森林、轻量级梯度提升机和极端梯度提升5种预测模型，使用贝叶斯优化算法调整模型的超参数，再以验证集评估模型性能，以筛选出最优模型。应用夏普利加性解释方法对最优模型进行解释。结果共收集到355例中重度抑郁症住院患者的病历资料，其中有效组285例、无效组70例，治疗有效率为80.28%。经过特征变量筛选，得到与疗效相关的5个特征变量，分别为汉密尔顿焦虑量表评分、血尿素氮、合用抗焦虑药物、饮酒史、首次发病。与其他模型相比，随机森林模型的性能表现最优，其受试者工作特征曲线下面积值为0.85，精确率-召回率曲线下面积值为0.87，准确度为0.74，召回率为0.75。结论基于5种特征变量建立的随机森林模型可用于中重度抑郁症住院患者使用SNRI类药物的疗效预测。

关键词：
5-羟色胺去甲肾上腺素再摄取抑制剂
中重度抑郁症
机器学习
疗效
预测模型
加入收藏

抑郁症是常见的精神疾病之一，其特点是持续的情绪低迷、兴趣缺失和愉悦感降低，若持续发展可引起一系列躯体症状，甚至使患者出现自杀倾向，严重影响其生活质量[1]。抑郁症的治疗方法主要为药物疗法和心理疗法。5-羟色胺去甲肾上腺素再摄取抑制剂（serotoninnoradrenalinreuptakeinhibitor，SNRI）是治疗抑郁症的常用一线药物，但接受SNRI类药物治疗的患者中有超过50%的症状没有得到有效缓解[2]。多项研究表明，中重度抑郁症患者早期症状的显著改善对其长期的整体转归具有重要作用[3―5]，因此在其治疗过程中药物的选择显得尤为重要。目前精神科医师一直尝试了解与药物或心理治疗反应有关的因素，以便个体化患者的治疗选择。近年来，机器学习在医学领域逐渐被广泛应用，其能对多维数据集进行自我学习，发现数据之间的内在联系，使得对患者疗效的预测成为可能[6]。本研究通过收集中重度抑郁症住院患者信息，运用机器学习方法构建该类患者使用SNRI类药物的疗效预测模型，以期为临床提供一种高效且可靠的工具。

1、资料与方法

1.1　研究对象及纳排标准

本研究回顾性收集了2022年1月至2024年10月在新疆某三甲医院住院治疗的中重度抑郁症患者信息。

纳入标准为：（1）符合《疾病和有关健康问题的国际统计分类》（第10次修订本）中的中度与重度抑郁症的诊断标准[1]；（2）18～65岁；（3）24项汉密尔顿抑郁量表（Hamil‐tonDepressionScale-24，HAMD-24）得分＞20分[7]；（4）使用SNRI类抗抑郁药。

排除标准为：（1）有器质性脑疾病或脑外伤史者；（2）对所使用的药物成分过敏者；（3）物质使用障碍、精神分裂症、癔症、双相情感障碍、惊恐障碍、强迫症患者；（4）妊娠期或哺乳期女性；（5）治疗期间接受改良电休克治疗者；（6）合用两种及以上抗抑郁药物者。本研究已获新疆维吾尔自治区人民医院伦理委员会批准（伦理意见编号：KY2024120219）。

1.2　研究方法

1.2.1　资料收集

本研究基于文献与现有病历系统资料，收集可能影响患者治疗效果的相关变量57个，包括：（1）人口统计学信息——年龄、性别、民族、婚姻状况、学历、职业性质、体重指数（bodymassindex，BMI）、吸烟史、饮酒史；（2）临床特征——抑郁症分型、（是否）首次发病、共病焦虑症、共病高血压、共病糖尿病、共病冠心病、住院天数；（3）用药前实验室检查指标——丙氨酸转氨酶、天冬氨酸转氨酶、血尿素氮（bloodureanitrogen，BUN）、肌酐、甘油三酯、总胆固醇、高密度脂蛋白、低密度脂蛋白、C反应蛋白、催乳素、雌二醇、睾酮、孕酮；（4）治疗期间测评量表结果——HAMD-24评分、汉密尔顿焦虑量表（HamiltonAnxietyScale，HAMA）评分、90项症状自评量表（SymptomChecklist-90，SCL-90）中的10个核心因子（躯体化、强迫症状、人际关系敏感、抑郁、焦虑、敌对、恐怖、偏执、精神病性、其他）评分、艾森克人格问卷（EysenckPersonalityQuestionnaire，EPQ）中4个核心人格维度（外向性、神经质、精神质、掩饰性）评分、匹兹堡睡眠质量指数（PittsburghSleepQualityIndex，PSQI）评分、社会功能缺陷筛选量表（SocialDisabilityScreeningSchedule，SDSS）评分、哥伦比亚自杀严重程度评定量表（Columbia-suicideSeverityRatingScale，C-SSRS）评分、修订版外显攻击行为量表（ModifiedOvertAggressionScale，MOAS）评分；（5）治疗措施——抗抑郁药物、抗精神病药物、改善睡眠药物、抗焦虑药物、心境稳定剂、舒肝解郁胶囊的使用情况，以及针灸治疗例数和心理治疗次数。

1.2.2　疗效判断标准及分组

本研究以HAMD-24评分减分率作为疗效判断标准。该量表由主管医师根据患者症状进行打分，总分≤8分为正常状态，9～20分为轻度抑郁症，21～34分为中度抑郁症，≥35分为重度抑郁症[7]。治疗有效定义为患者出院时HAMD-24评分较入院时基线值降低≥50%；治疗无效定义为患者出院时HAMD-24评分较入院时基线值降低＜50%[7]。据此，住院患者被分为两组：有效组和无效组。

1.2.3　数据预处理

本研究收集到的患者信息，部分变量存在缺失值，而在统计分析中忽略缺失数据会产生严重偏倚。为符合建模要求，本研究对缺失率≥30%的变量进行删除，不将其纳入模型构建；对缺失率＜30%的变量，运用R软件mice包中的多重插补法进行插补，插补次数为5次，插补模型为预测均值匹配模型。多重插补法通过利用已有的完整数据多次模拟生成多个数据集来填补缺失值，其优点在于考虑了数据之间的复杂关系，使得插补后的数据在分布上与原始数据更为接近，偏倚较小[8]。本研究结局变量中无效组的样本数量较少，使得分类结果更易于偏向有效样本数据，导致模型性能下降。为了解决分类不平衡问题，本研究使用R语言软件reci‐pes包中合成少数类过采样技术（syntheticminorityoversamplingtechnique，SMOTE）平衡数据样本，采样比例为1∶1，该技术通过分析少数类样本在特征空间中的分布，利用其近邻样本进行线性插值，合成新的少数类样本，与现有样本组成新的训练集[9]。

此外，本研究对分类变量进行独热编码处理，使数据符合机器学习运行过程；对连续变量进行Z-score标准化处理，以消除变量单位不同导致的数据差异。

1.2.4　特征变量的选择

本研究运用R4.2.1软件中glmnet包中最小绝对值收缩和选择算子（leastabsoluteshrinkageandselectionoperator，LASSO）回归分析及十折交叉验证选择出惩罚项λ值的拟合模型，以筛选最佳特征变量。其中LASSO回归分析是一种通过引入L1正则化，将不重要特征变量的惩罚项系数压缩为0来选择特征和降维，以筛选贡献大的特征和消除冗余特征的方法[10]。

1.2.5　模型构建与性能评估

本研究运用R4.2.1软件中tidymodels包构建模型，将LASSO回归分析筛选得到的预测特征变量纳入模型构建。将数据集按7∶3的采样比例划分为训练集与验证集，其中训练集用于模型拟合与超参数调整，具体操作为：（1）构建5种机器学习模型，包括支持向量机（sup‐portvectormachine，SVM）、k近邻（k-nearestneighbor，KNN）、随机森林（randomforest，RF）、轻量级梯度提升机（lightweightgradientboostingmachine，LightGBM）和极端梯度提升（extremegradientboosting，XGBoost）模型。（2）使用五折交叉验证与贝叶斯优化算法调整超参数与优化模型。贝叶斯优化算法在尝试下一组超参数时，能通过分析以往的训练和评估结果，来指导当前超参数的调整，以实现模型性能的动态更新和优化，在提高搜索效率和精度方面较网格搜索更具有优势[11]。在超参数调整过程中，以模型的受试者工作特征曲线下面积（areaunderthereceiveroperatingcharacteristiccurve，ROCAUC）值作为评价指标，通过最大化的ROCAUC值来确定最优超参数组合。验证集用于评估训练好的模型性能，以ROCAUC值、精确率-召回率曲线下面积（areaundertheprecision-recallcurve，PRAUC）值、准确度、灵敏度、精确率、召回率作为预测模型的性能评价指标。此外，本研究还绘制了受试者工作特征曲线、精确率-召回率曲线（precision-recallcurve，PR）、校准曲线与决策曲线（decisioncurveanalysis，DCA），以进一步分析和展示预测模型在实际临床应用中的效用。1.2.6　模型解释

采用夏普利加性解释（Shapleyadditiveexplana‐tions，SHAP）方法来解释性能最优的模型。SHAP是一个解释机器学习模型的统一框架，根据博弈论估计每个特征的贡献，以此来衡量每个特征对预测结果的影响[12]。通过计算训练集中每位患者样本数据的SHAP值，可以深入了解每个指标对预测模型的贡献。

1.2.7　统计分析

运用R4.2.1软件进行统计分析。计量资料通过峰度和偏度检验，以确定是否遵循正态分布，若符合正态分布则用x±s描述，组间比较采用独立样本t检验；若非正态分布则用M（P25，P75）描述，组间比较采用MannWhitneyU检验。计数资料采用例数或占比（%）描述，组间比较采用χ2检验。检验水准α＝0.05。

2、结果

2.1　基线信息

本研究收集到符合纳入标准的中重度抑郁症住院患者共355例，其中女性占77.46%（n＝275）；所有患者平均年龄为44岁。有效组患者有285例，无效组患者有70例，抗抑郁治疗有效率为80.28%。两组患者的部分基线资料信息见表1，入院治疗措施见表2。由表1可知，有效组与无效组患者在BUN、首次发病、HAMA评分上的差异有统计学意义（P＜0.05）。由表2可知，住院患者多采用联合治疗方式，有效组与无效组患者在合用抗焦虑药物上的差异有统计学意义（P＜0.05）；SNRI类药物中使用频率最高的为文拉法辛（64.51%）；联合用药方案中，常用药物为抗精神病药物（94.93%）、改善睡眠药物（96.34%）和抗焦虑药物（43.94%）。

2.2　特征变量选择结果

使用LASSO回归筛选与疗效相关的特征变量，采用十折交叉验证方法进行迭代分析，变量系数的变化如图1所示。为避免重要因素丢失与过度拟合发生，本研究选择最小λ值（lambda.min）为0.031；将对结局影响不重要的特征变量惩罚项系数逐渐压缩为0，最终从57个变量中筛选出与疗效密切相关的5个变量：HAMA评分（β＝－0.017）、合用抗焦虑药物（β＝0.106）、饮酒史（β＝－0.025）、BUN（β＝0.0001）、首次发病（β＝0.179）。

2.3　模型构建与性能评估结果

本研究根据LASSO回归筛选的结果，对分类变量进行编码，规则为：合用抗焦虑药物为“无”的编码为0，表1　两组患者的部分基线资料信息比较结果

2.2　特征变量选择结果使用LASSO回归筛选与疗效相关的特征变量，采用十折交叉验证方法进行迭代分析，变量系数的变化如图1所示。为避免重要因素丢失与过度拟合发生，本研究选择最小λ值（lambda.min）为0.031；将对结局影响不重要的特征变量惩罚项系数逐渐压缩为0，最终从57个变量中筛选出与疗效密切相关的5个变量：HAMA评分（β＝－0.017）、合用抗焦虑药物（β＝0.106）、饮酒史（β＝－0.025）、BUN（β＝0.0001）、首次发病（β＝0.179）。

2.3　模型构建与性能评估结果

本研究根据LASSO回归筛选的结果，对分类变量进行编码，规则为：合用抗焦虑药物为“无”的编码为0，为“坦度螺酮”的编码为1，为“丁螺环酮”的编码为2；首次发病为“是”的编码为1，为“否”的编码为2；饮酒史为“有”的编码为1，为“无”的编码为2。

基于特征变量选择结果得到的5个变量构建了5个机器学习模型，包括KNN、SVM、RF、LightGBM和XGBoost模型。用训练集构建预测模型并进行模型超参数优化，结果见表3；用验证集评估各模型性能，结果见表4。由表4可知，RF模型的ROCAUC值（0.85）、PRAUC值（0.87）、准确度（0.74）、召回率（0.75）最高，精确率（0.73）、灵敏度（0.77）也较高，说明该模型优于其他模型。各模型的ROCAUC值与PRAUC值见图2，可见RF模型优于其他模型；各模型的校准曲线见图3，可见XGBoost模型的预测概率接近实际预测概率（图中虚线），其次为RF模型；各模型的决策曲线结果见图4，可见RF曲线接近右上角且高于TreatAll曲线，说明RF模型更具有临床效用。综合以上结果可得，RF模型在多个关键性能指标上表现最佳，故选定RF模型为最优模型。

表2　两组患者入院治疗措施比较结果

图1LASSO回归变量筛选过程

表3　模型超参数优化结果

表4　模型性能评估结果

图2　机器学习模型的受试者工作特征曲线与PR

图3　机器学习模型的校准曲线

2.4　模型解释结果

使用SHAP方法对最优预测模型RF进行解释，可通过SHAP值了解每个特征变量对模型预测结果的贡献程度，结果见图5、图6。从图5、图6可知，5个特征变量中，HAMA评分对模型预测的贡献最大且呈现负向影响，随后的贡献程度排序依次为BUN、合用抗焦虑药物、首次发病、饮酒史。

图4　机器学习模型的决策曲线

图5RF模型的SHAP变量重要度排序

图6RF模型的SHAP值蜂窝图

3、讨论

3.1SNRI类药物抗抑郁治疗的效果分析

本研究收集的中重度抑郁症住院患者使用SNRI类药物的治疗有效率为80.28%，高于文献[2]报道的50%，其可能原因有：（1）本研究收集的样本来自住院患者，住院期间得到临床医护人员更好的治疗和护理；（2）本研究住院患者大多数为中度抑郁（91.27%），且入院时HAMD-24评分为（25.17±4.61）分，表明其抑郁症状相对较轻；（3）患者住院过程中采用了多种治疗方式，包括使用多种改善症状的药物与心理治疗方案。与既往研究建立的单一用药疗效预测模型不同，本研究患者存在SNRI类抗抑郁药物与多种增效药物联用的情况。已有研究表明，治疗抑郁症的过程中，在单一抗抑郁药物治疗效果有限时，可增加另一类药物增效治疗[13―14]。此外，本研究还发现，SNRI类药物使用最多的为文拉法辛（64.51%），现有证据也表明文拉法辛的临床治愈率高于5-羟色胺再摄取抑制剂[15]。

3.2SNRI类药物抗抑郁疗效的影响因素分析

SHAP值是特征变量重要性的量化指标，其明确反映了特征变量对预测结果的影响。SHAP值蜂窝图分析结果显示，患者入院时较高的HAMA评分、不合用抗焦虑药物、较高的BUN水平、非首次发病、存在饮酒史对中重度抑郁症的治疗呈现显著的负向影响趋势。HAMA评分由主管医师根据患者症状综合打分得到，能够反映患者焦虑症状的严重程度，HAMA评分越高，其治疗无效的发生风险越高。多项研究结果表明，共病严重焦虑的抑郁症患者对抗抑郁药物的治疗反应较差，且严重的焦虑症状与较长的抑郁症治疗反应时间和较短的抑郁复发时间呈现相关性[16―17]。抑郁症患者合用抗焦虑药物不仅能有效改善焦虑症状，还能起到一定的抗抑郁作用，发挥协同增效作用。STAR*D研究结果也证实，抗焦虑药物与抗抑郁药物联合使用可以提高抑郁症的治疗有效率[16]。BUN能反映肾脏排泄功能，肾功能减退（BUN升高）可能导致SNRI类药物的活性代谢物（如O-去甲基文拉法辛）在体内蓄积，改变血药浓度，从而影响疗效[18]。相较于首次发病的抑郁症患者，非首次发病的患者可能病情更为慢性或难治，管理策略需包括长期药物治疗和定期心理治疗，以降低复发频率和缓解病情严重性。Buckman等[19]的研究结果也论证了抑郁症的复发史是一个强有力的成人抑郁症复发风险预测指标。长期饮酒可能导致大脑对神经递质（如血清素和多巴胺等）的敏感性降低，从而可能引发抑郁风险[20]；同时，酒精滥用不仅会加重已有的抑郁症状，还与更高的自杀风险相关，从而影响抑郁症的治疗效果[21]；此外，有研究表明酗酒的抑郁症患者对抗抑郁药物还表现出抵抗性[22]。由此可见，上述5个特征变量是影响中重度抑郁症住院患者使用SNRI类药物疗效的重要因素。

3.3SNRI类药物抗抑郁疗效预测模型的构建与评价

相较于传统统计学，机器学习不依赖于变量间显著关系的先验检验，能自动学习复杂数据之间的联系，并在新数据上有很强的泛化能力，因此其应用更加灵活[23]。本研究中，模型的构建依托于真实世界中的观察性数据，该类数据以其低成本、可快速收集和覆盖异质性人群的特点，日益成为个体化干预效果评估研究的关键资源。本研究运用SMOTE处理不平衡数据集，可提高少数类别的预测能力，避免模型过拟合；采用LASSO回归技术进行特征变量筛选，可以降低模型的复杂程度，防止过拟合发生，最终筛选出5个关键特征，即HAMA评分、BUN、合用抗焦虑药物、首次发病、饮酒史，然后基于以上特征运用了5种不同的机器学习算法构建并验证模型。所有模型在验证集中的比较结果显示，RF模型的ROCAUC值和PRAUC值均为最大，而在所有性能评估指标中，ROCAUC和PRAUC能更好地显示出模型的分类性能；同时，决策曲线可用于评估预测模型在临床或实际决策中的价值，而RF模型在决策曲线上表现出了更好的适用性，由此可知，RF模型具有更好的预测性能。

综上所述，本研究基于真实世界数据，深入分析了中重度抑郁症住院患者使用SNRI类药物后影响疗效的相关特征变量，建立的RF模型可对中重度抑郁症住院患者使用SNRI类药物后的疗效进行预测。该模型可以集成到移动应用程序中，并结合电子病历数据，为患者提供个体化的治疗建议。临床医师可以将影响疗效的变量输入预测模型以提前识别可能治疗无效的患者，及时对患者调整治疗策略，以避免无效的药物使用和治疗延误。但是，本研究也存在一定的局限性：一是本研究属于单中心回顾性研究，存在一定的回忆偏倚，建议未来开展更大规模的前瞻性研究并在更大的外部数据集上进一步验证本研究结论。二是本研究所收集的病历信息不够全面，可能限制了预测模型的价值，建议未来研究纳入更全面的因素，包括药物代谢基因及环境因素（饮食习惯和压力源等）作为预测变量，以提高预测模型的性能。

参考文献:

[1]陆林.沈渔邨精神病学[M].6版.北京:人民卫生出版社,2018:877-900.

[7]中华医学会行为医学分会,中华医学会行为医学分会认知应对治疗学组,王长虹,等.抑郁症治疗与管理的专家推荐意见:2022年[J].中华行为医学与脑科学杂志,2023(3):193-202.

[10]谢宏宇,侯艳,李康.基于正则化回归的组学数据变量筛选方法[J].中国卫生统计,2016,33(4):733-736.

[11]崔佳旭,杨博.贝叶斯优化方法和应用综述[J].软件学报,2018,29(10):3068-3090.

[12]吴妍.基于机器学习的糖尿病早期诊断模型及可解释分析[D].重庆:重庆理工大学,2024.

[15]李凌江,马辛.中国抑郁障碍防治指南[M].2版.北京:中华医学电子音像出版社,2015:59-80.

[18]谢焕山,黄毅,黄善情,等.基于治疗药物监测的O-去甲基文拉法辛与文拉法辛浓度比值影响因素分析[J].中国临床药理学杂志,2022,38(20):2419-2422

基金资助:“天山英才”医药卫生高层次人才培养计划项目(No.TSYC202301A028);

文章来源:刘学涛,刘阳,李红建,等.基于机器学习构建中重度抑郁症住院患者使用SNRI类抗抑郁药的疗效预测模型[J].中国药房,2025,36(15):1936-1941.