91学术服务平台

您好,欢迎来到91学术官网!站长邮箱:91xszz@sina.com

发布论文

论文咨询

基于多中心真实世界数据构建丙戊酸钠血药浓度预测模型

  2025-08-22    54  上传者:管理员

摘要:目的 基于机器学习算法,建立丙戊酸钠血清药物浓度范围的预测模型,指导精准用药。方法 收集西安国际医学中心医院、咸宁市中心医院使用丙戊酸钠并进行血药浓度监测的患者信息,通过XGBoost、GBDT、AdaBoost、CatBoost、LightGBM、RF、DT、Extra-Tree、LR、BPNN、KNN、SVR建立丙戊酸钠血清药物浓度范围的预测模型,比较其预测性能。结果 共收集到770例血药浓度数据,以8∶2的比例分为训练队列和测试队列。使用12种算法建立了丙戊酸钠血清药物浓度范围预测模型,其中GBDT算法准确率(训练队列为0.987,五倍交叉验证结果为0.637;测试队列为0.617)、召回率(训练队列为0.987,5倍交叉验证结果为0.637;测试队列为0.617)、精确率(训练队列为0.987,5倍交叉验证结果为0.635;测试队列为0.610)、F1(训练队列为0.987,5倍交叉验证结果为0.626;测试队列为0.593)。在训练队列和5倍交叉验证中表现最优,但在测试队列中排名有所下降。结论 本研究建立的丙戊酸钠血清药物浓度范围预测模型性能较好,有助于个体化精准用药。

  • 关键词:
  • 丙戊酸钠
  • 机器学习
  • 治疗药物监测
  • 短链脂肪酸
  • 预测模型
  • 加入收藏

丙戊酸(valproic acid,VPA)是一种短链脂肪酸,可通过抑制γ-氨基丁酸(GABA)转氨酶及钠离子和L型钙离子通道发挥药理活性,不仅被广泛用于治疗癫痫发作和双相情感障碍,还在心血管、糖尿病、肾脏等疾病中发挥作用[1-2]。丙戊酸钠的治疗作用和不良反应与其血药浓度有关,其治疗药物监测范围为50~100 mg·L-1[3],丙戊酸钠血药浓度小于50 mg·L-1时,可能导致治疗效果不佳,血药浓度大于100 mg·L-1时,可能增加中枢系统毒性与肝毒性等风险,因此有必要开展丙戊酸钠治疗药物监测[4-6]。机器学习(machine learning,ML)是人工智能(artificial intelligence,AI)的一个分支,其通过使用算法和统计模型,使计算机能够结构化地从数据中学习和改进,同时在新的数据中做出预测或决策,适宜处理大量的现实数据,处理缺失值和高维数据,捕捉变量之间的复杂关系,近年来被广泛用于医学领域[7-8]。Zhu等[9]基于中国人群丙戊酸钠群体药代动力学(population pharmacokinetics,PPK)模型的协变量和描述丙戊酸药代动力学的单室模型,使用蒙特卡洛模拟构建了一个数据集,开发了极端梯度提升(extreme gradient boosting,XGBoost)模型来估计丙戊酸的稳态浓度(Css),但缺乏高质量真实世界研究。本研究拟通过多中心真实世界数据,使用12种机器学习方法建立癫痫患者丙戊酸钠血药浓度监测预测模型,比较其性能,以辅助临床优化治疗方案。


1、资料与方法


1.1 研究对象  

本研究对2019年1月至2023年12月期间在西安国际医学中心医院和咸宁市中心医院接受丙戊酸钠治疗的癫痫患者进行回顾性分析。纳入标准:符合癫痫诊断;至少连续给药5 d后测丙戊酸钠血清药物浓度。排除标准:间断服用丙戊酸钠者;病例资料不全或无法获取者。本研究根据CIOMS/WHO人类健康相关研究国际道德准则(2016),研究数据已完全删除患者私密信息,经西安国际医学中心医院与咸宁市中心医院伦理委员会批准(GJYX-KY-2024-006、咸医伦字-K【2024】013号)。

1.2 试药与仪器  

丙戊酸钠缓释片(Sanofi Winthrop Industrie,规格:500 mg/片);丙戊酸钠口服溶液[赛诺菲(杭州)制药有限公司,规格:300 mL/12 g];丙戊酸钠片(湖南省湘中制药有限公司,规格:0.2 g/片);注射用丙戊酸钠(沈阳新马药业,规格:0.4 g)。  Syva Viva-E药物浓度分析系统(Siemens公司);丙戊酸检测试剂(Siemens Healthcare Diagnostics Inc)。

1.3 数据提取与处理  

从电子病历系统中提取病历信息,包括年龄、性别、丙戊酸钠血药浓度信息(同一患者两次血药浓度监测的间隔时间大于7 d,可认为是独立数据)、丙戊酸钠的给药剂量及给药途径、合并疾病、实验室生化指标、合并用药(碳青霉烯类药物、苯巴比妥、苯二氮䓬类等)。

1.4 模型建立  

将丙戊酸钠血药浓度值分为不达标组(Css<50mg·L-1)、达标组(50 mg·L-1≤Css≤100 mg·L-1)、超限组(Css>100 mg·L-1),通过相关性分析及极端梯度提升树(extreme gradient boosting,XGBoost)特征重要性评分筛选模型特征变量,使用XGBoost、梯度提升树(gradient boosting decisiontree,GBDT)、自适应提升算法(adaptive boosting,AdaBoost)、梯度提升类别型特征算法(categoricalboosting,CatBoost)、轻量梯度提升(light gradientboosting machine,LightGBM)、随机森林(randomforest,RF)、决策树(decision tree,DT)、极度随机树(extremely randomized trees,Extra-Tree)、逻辑回归(logistic regression,LR)、反向传播神经网络(back propagation neural network,BPNN)、k-近邻算法(k-nearest neighbors,KNN)、支持向量回归(support vector regression,SVR)共计12种机器学

习算法建立预测模型,通过调整正则化参数(L1、L2)防止模型过拟合,通过准确率、召回率、精确率、F1等指标比较模型性能,选择最优模型进行验证。准确率是预测正确样本占总样本的比例,其值越大模型性能越优;召回率指实际为正样本的结果中,预测为正样本的比例,其值越大模型性能越优;精确率指预测为正样本的结果中,实际为正样本的比例,其值越大模型性能越优;F1为精确率和召回率的调和平均。

1.5 统计方法  

排除整体缺失值>25%的变量,采用SPSS26对剩余变量进行数据分析,对于连续变量,如符合正态分布则以平均值±标准差(x±s)表示,采用方差分析进行比较;不符合正态分布以四分位距(IQR)表示,采用秩和检验进行比较;计数资料以n(%)表示,采用χ2检验进行比较,以P<0.05为差异有统计学意义。以Spearman相关性检验分析各变量与丙戊酸钠血药浓度结果的相关性,以P<0.05为差异有统计学意义。以SPSSPRO(scientific platform serving for statisticsprofessional)构建机器学习模型,通过准确率、召回率、精确率、F1等指标比较模型性能。


2、结果


2.1 一般资料  

共纳入532名患者(西安国际医学中心医院319人,咸宁市中心医院213人)、770例次丙戊酸钠血药浓度信息(西安国际医学中心医院516例,咸宁市中心医院254例)、32个变量指标(其中镁离子数据缺失大于25%,被排除在外)。纳入的血药浓度数据中,男性523例次,女性247例次,中位年龄为35.00岁(IQR 39.75~65.00),丙戊酸钠日剂量中位值1.00 g(IQR 1.00~1.20),血药浓度中位值为69.60 mg·L-1(IQR 46.34~87.99),按照8∶2的比例分为训练队列和测试队列。两组基线资料如表1所示,一般资料比较差异均无统计学意义(P>0.05)。

表1 研究人群的基线特征

2.2 特征变量分析  

共有30个自变量,相关性分析结果显示,合用碳青霉烯类药物、性别、红细胞计数、血肌酐水平、丙戊酸钠剂量、心力衰竭、间接胆红素、钾离子、巴比妥类药物、白蛋白水平、贫血、糖尿病、总胆红素等13个自变量与丙戊酸钠血药浓度的相关性差异具有统计学意义,各变量的XGBoost重要性评分结果如表2所示。

表2 丙戊酸钠血药浓度预测模型中独立变量的重要性评分和相关性分析

2.3 丙戊酸钠血药浓度预测模型的构建  

使用筛选的13项特征变量,基于XGBoost、GBDT、AdaBoost、CatBoost、LightGBM、RF、DT、Extra-Tree、LR、BPNN、KNN、SVR等12种机器学习算法建立丙戊酸钠血清药物浓度预测模型,其中GBDT模型的性能最优,准确率为0.987、召回率为0.987、精确率为0.987、F1值为0.987,结果如表3所示。为了进一步巩固模型的性能,使用五倍交叉法验证12种模型性能,结果显示,所有模型预测性能均有所下降,其中GBDT模型的准确率为0.637、召回率为0.637、精确率为0.635、F1值为0.626,结果如表4所示。

2.4 丙戊酸钠血药浓度预测模型的验证  

使用测试队列对12种预测模型进行测试,GBDT模型测试结果为:准确率为0.617、召回率为0.617、精确率为0.610、F1值为0.593,说明构建的GBDT模型对丙戊酸钠血药浓度的预测性能较好,与训练队列相符合,模型的测试结果如表5所示。

表3 训练队列中12个预测模型的性能

表4 使用五倍交叉法验证12个模型的性能

表5 测试队列中12个预测模型的性能


3 讨论


为了提高丙戊酸钠治疗效果、降低不良反应,多国学者采用非线性混合效应模型方法,建立了丙戊酸钠PPK模型,用以指导个体化药物治疗方案[10-12]。但PPK模型缺乏药物作用机制的解释,并且需要根据给药方式和数据类型选择固定的药代动力学模型(一室、二室),在实际操作过程中往往受到数据限制[13-14]。相比PPK模型,机器学习不仅可以通过综合考虑患者生理特征、疾病进程以及药物治疗等准确地预测药物疗效,还可用于处理大数据集与复杂模型的筛选[15-16]。此外,相比同类研究仅构建了一种XGBoost模型而言,本文通过真实世界数据筛选了更多的特征变量,构建了12种预测模型,从而筛选出最优模型,更具有代表性[9]。

本研究通过机器学习方法基于多中心真实世界数据构建丙戊酸血药浓度多分类预测模型。机器学习是一门涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多领域的交叉学科,目前广泛应用于医学研究领域。相对于普通回归,机器学习模型的复杂性高、适用范围更广,更适用于处理高维度和非线性问题,泛化能力更强。XGBoost是集成学习算法中的一种,具有正则化能力、并行处理能力、特征重要性分析及非线性问题处理能力等,广泛地用于机器学习特征变量的提取。本研究基于双中心真实世界数据,采用XGBoost算法提取特征变量,并通过XGBoost、GBDT、AdaBoost、CatBoost、LightGBM、RF、DT、Extra-Tree等12种机器学习算法建立丙戊酸钠血清药物浓度预测模型,其中GBDT模型综合效能最优(准确率=0.987,召回率=0.987,精确率=0.987,F1值=0.987)。对预测模型采用五倍交叉验证及多中心外部数据测试验证,结果准确率为0.637、0.617,召回率为0.637、0.617,精确率为0.635、0.610,F1值为0.626、0.593,预测模型显示出良好的预测性能,具有较高的准确度、灵敏度和良好的泛化能力,但是本研究构建的12种模型在五倍交叉验证与测试队列验证时准确率、召回率、精确率、F1均大幅降低,存在过拟合现象,且调整正则化参数(L1、L2),过拟合现象改善不明显,因此在临床应用中存在一定的局限性。  本研究模型特征变量部分已经过其他学者验证[17-22],可靠性较高,模型显示出良好的可解释性。首先,在人口统计信息方面,多篇研究提示年龄、性别、体重及药物剂量是影响丙戊酸钠血清药物浓度的主要因素,可与本文研究相互印证[17-18]。其次,胆红素与血肌酐等指标与患者肝肾功能有关,胆红素升高的患者往往肝功能异常,影响丙戊酸钠代谢,血肌酐升高的患者肾功能减退,对丙戊酸钠的清除能力减弱,研究显示,总胆红素、直接胆红素升高是丙戊酸钠浓度剂量比(CDRV)升高的独立危险因素,提示肝功能障碍可使丙戊酸钠浓度升高,与本文结论一致,但心力衰竭、糖尿病、钾离子水平等影响丙戊酸钠血药浓度值的原因尚不明确[19]。最后,药物相互作用也是影响丙戊酸钠血药浓度的因素之一,多项研究显示联合使用碳青霉烯类药物可显著降低丙戊酸钠及其代谢产物的浓度,甚至部分研究将碳青霉烯类药物作为丙戊酸钠过量中毒的解毒剂[20-21],苯巴比妥可通过诱导加速丙戊酸钠代谢,降低其药物浓度[22],本文研究提示联合使用碳青霉烯类药物对丙戊酸钠血药浓度预测模型影响最大,苯巴比妥也可在不同程度上影响丙戊酸钠血药浓度值。

本研究首次发现与正常人群相比,贫血患者的丙戊酸钠血药浓度值显著降低,红细胞计数与血药浓度值成正相关,两者可作为特征变量预测丙戊酸钠血药浓度值。在616例训练集数据中232例贫血患者丙戊酸钠血药浓度(62.41±32.74)μg·mL-1及达标率(48.28%)均显著低于384例非贫血患者血药浓度(74.14±29.43)μg·mL-1与达标率(59.64%)。由于未查询到贫血影响丙戊酸钠血药浓度的机制,笔者猜测其可能通过某种因素,间接影响丙戊酸钠血药浓度,因此分析了贫血与其他变量的关系,发现本文纳入的贫血患者血清白蛋白水平(34.59±4.81)g·L-1显著低于非贫血患者(38.88±5.28)g·L-1,而丙戊酸钠血清蛋白结合率高,低蛋白血症患者血清游离丙戊酸钠增多,清除加快,可能对丙戊酸钠血药浓度产生影响,但仍需进一步研究。

综上所述,本研究依据多中心真实世界的数据,构建了可预测丙戊酸钠血药浓度范围的机器学习预测模型,模型有良好的准确性、适用性及泛化能力,对于指导临床丙戊酸钠个体化精准用药具有较强的参考价值。尽管如此,研究也有不足,构建模型在测试队列中各项性能均有所下降,可能与本研究未纳入患者的遗传信息作为特征变量且数据量较少有关,因此尚需多中心、大样本量的数据进一步研究、优化。


基金资助:西安国际医学中心医院青年课题(No.2023QN05);咸宁市中心医院院级科研项目(No.2022XYB033);咸宁市自然科学基金项目(No.2021ZRKX036);


文章来源:徐金军,洪术霞,史金平,等.基于多中心真实世界数据构建丙戊酸钠血药浓度预测模型[J].中南药学,2025,23(08):2433-2438.

分享:

91学术论文范文

相关论文

推荐期刊

网友评论

加载更多

我要评论

中南药学

期刊名称:中南药学

期刊人气:5370

期刊详情

主管单位:湖南省食品药品监督管理局

主办单位:湖南省药学会,湖南省药学会

出版地方:湖南

专业分类:医学

国际刊号:1672-2981

国内刊号:43-1408/R

邮发代号:42-290

创刊时间:2003年

发行周期:月刊

期刊开本:大16开

见刊时间:1年以上

论文导航

查看更多

相关期刊

热门论文

【91学术】(www.91xueshu.com)属于综合性学术交流平台,信息来自源互联网共享,如有版权协议请告知删除,ICP备案:冀ICP备19018493号

微信咨询

返回顶部

发布论文

上传文件

发布论文

上传文件

发布论文

您的论文已提交,我们会尽快联系您,请耐心等待!

知 道 了

登录

点击换一张
点击换一张
已经有账号?立即登录
已经有账号?立即登录

找回密码

找回密码

你的密码已发送到您的邮箱,请查看!

确 定