摘要:目的 基于机器学习算法,建立丙戊酸钠血清药物浓度范围的预测模型,指导精准用药。方法 收集西安国际医学中心医院、咸宁市中心医院使用丙戊酸钠并进行血药浓度监测的患者信息,通过XGBoost、GBDT、AdaBoost、CatBoost、LightGBM、RF、DT、Extra-Tree、LR、BPNN、KNN、SVR建立丙戊酸钠血清药物浓度范围的预测模型,比较其预测性能。结果 共收集到770例血药浓度数据,以8∶2的比例分为训练队列和测试队列。使用12种算法建立了丙戊酸钠血清药物浓度范围预测模型,其中GBDT算法准确率(训练队列为0.987,五倍交叉验证结果为0.637;测试队列为0.617)、召回率(训练队列为0.987,5倍交叉验证结果为0.637;测试队列为0.617)、精确率(训练队列为0.987,5倍交叉验证结果为0.635;测试队列为0.610)、F1(训练队列为0.987,5倍交叉验证结果为0.626;测试队列为0.593)。在训练队列和5倍交叉验证中表现最优,但在测试队列中排名有所下降。结论 本研究建立的丙戊酸钠血清药物浓度范围预测模型性能较好,有助于个体化精准用药。
加入收藏
丙戊酸(valproic acid,VPA)是一种短链脂肪酸,可通过抑制γ-氨基丁酸(GABA)转氨酶及钠离子和L型钙离子通道发挥药理活性,不仅被广泛用于治疗癫痫发作和双相情感障碍,还在心血管、糖尿病、肾脏等疾病中发挥作用[1-2]。丙戊酸钠的治疗作用和不良反应与其血药浓度有关,其治疗药物监测范围为50~100 mg·L-1[3],丙戊酸钠血药浓度小于50 mg·L-1时,可能导致治疗效果不佳,血药浓度大于100 mg·L-1时,可能增加中枢系统毒性与肝毒性等风险,因此有必要开展丙戊酸钠治疗药物监测[4-6]。机器学习(machine learning,ML)是人工智能(artificial intelligence,AI)的一个分支,其通过使用算法和统计模型,使计算机能够结构化地从数据中学习和改进,同时在新的数据中做出预测或决策,适宜处理大量的现实数据,处理缺失值和高维数据,捕捉变量之间的复杂关系,近年来被广泛用于医学领域[7-8]。Zhu等[9]基于中国人群丙戊酸钠群体药代动力学(population pharmacokinetics,PPK)模型的协变量和描述丙戊酸药代动力学的单室模型,使用蒙特卡洛模拟构建了一个数据集,开发了极端梯度提升(extreme gradient boosting,XGBoost)模型来估计丙戊酸的稳态浓度(Css),但缺乏高质量真实世界研究。本研究拟通过多中心真实世界数据,使用12种机器学习方法建立癫痫患者丙戊酸钠血药浓度监测预测模型,比较其性能,以辅助临床优化治疗方案。
1、资料与方法
1.1 研究对象
本研究对2019年1月至2023年12月期间在西安国际医学中心医院和咸宁市中心医院接受丙戊酸钠治疗的癫痫患者进行回顾性分析。纳入标准:符合癫痫诊断;至少连续给药5 d后测丙戊酸钠血清药物浓度。排除标准:间断服用丙戊酸钠者;病例资料不全或无法获取者。本研究根据CIOMS/WHO人类健康相关研究国际道德准则(2016),研究数据已完全删除患者私密信息,经西安国际医学中心医院与咸宁市中心医院伦理委员会批准(GJYX-KY-2024-006、咸医伦字-K【2024】013号)。
1.2 试药与仪器
丙戊酸钠缓释片(Sanofi Winthrop Industrie,规格:500 mg/片);丙戊酸钠口服溶液[赛诺菲(杭州)制药有限公司,规格:300 mL/12 g];丙戊酸钠片(湖南省湘中制药有限公司,规格:0.2 g/片);注射用丙戊酸钠(沈阳新马药业,规格:0.4 g)。 Syva Viva-E药物浓度分析系统(Siemens公司);丙戊酸检测试剂(Siemens Healthcare Diagnostics Inc)。
1.3 数据提取与处理
从电子病历系统中提取病历信息,包括年龄、性别、丙戊酸钠血药浓度信息(同一患者两次血药浓度监测的间隔时间大于7 d,可认为是独立数据)、丙戊酸钠的给药剂量及给药途径、合并疾病、实验室生化指标、合并用药(碳青霉烯类药物、苯巴比妥、苯二氮䓬类等)。
1.4 模型建立
将丙戊酸钠血药浓度值分为不达标组(Css<50mg·L-1)、达标组(50 mg·L-1≤Css≤100 mg·L-1)、超限组(Css>100 mg·L-1),通过相关性分析及极端梯度提升树(extreme gradient boosting,XGBoost)特征重要性评分筛选模型特征变量,使用XGBoost、梯度提升树(gradient boosting decisiontree,GBDT)、自适应提升算法(adaptive boosting,AdaBoost)、梯度提升类别型特征算法(categoricalboosting,CatBoost)、轻量梯度提升(light gradientboosting machine,LightGBM)、随机森林(randomforest,RF)、决策树(decision tree,DT)、极度随机树(extremely randomized trees,Extra-Tree)、逻辑回归(logistic regression,LR)、反向传播神经网络(back propagation neural network,BPNN)、k-近邻算法(k-nearest neighbors,KNN)、支持向量回归(support vector regression,SVR)共计12种机器学
习算法建立预测模型,通过调整正则化参数(L1、L2)防止模型过拟合,通过准确率、召回率、精确率、F1等指标比较模型性能,选择最优模型进行验证。准确率是预测正确样本占总样本的比例,其值越大模型性能越优;召回率指实际为正样本的结果中,预测为正样本的比例,其值越大模型性能越优;精确率指预测为正样本的结果中,实际为正样本的比例,其值越大模型性能越优;F1为精确率和召回率的调和平均。
1.5 统计方法
排除整体缺失值>25%的变量,采用SPSS26对剩余变量进行数据分析,对于连续变量,如符合正态分布则以平均值±标准差(x±s)表示,采用方差分析进行比较;不符合正态分布以四分位距(IQR)表示,采用秩和检验进行比较;计数资料以n(%)表示,采用χ2检验进行比较,以P<0.05为差异有统计学意义。以Spearman相关性检验分析各变量与丙戊酸钠血药浓度结果的相关性,以P<0.05为差异有统计学意义。以SPSSPRO(scientific platform serving for statisticsprofessional)构建机器学习模型,通过准确率、召回率、精确率、F1等指标比较模型性能。
2、结果
2.1 一般资料
共纳入532名患者(西安国际医学中心医院319人,咸宁市中心医院213人)、770例次丙戊酸钠血药浓度信息(西安国际医学中心医院516例,咸宁市中心医院254例)、32个变量指标(其中镁离子数据缺失大于25%,被排除在外)。纳入的血药浓度数据中,男性523例次,女性247例次,中位年龄为35.00岁(IQR 39.75~65.00),丙戊酸钠日剂量中位值1.00 g(IQR 1.00~1.20),血药浓度中位值为69.60 mg·L-1(IQR 46.34~87.99),按照8∶2的比例分为训练队列和测试队列。两组基线资料如表1所示,一般资料比较差异均无统计学意义(P>0.05)。
表1 研究人群的基线特征
2.2 特征变量分析
共有30个自变量,相关性分析结果显示,合用碳青霉烯类药物、性别、红细胞计数、血肌酐水平、丙戊酸钠剂量、心力衰竭、间接胆红素、钾离子、巴比妥类药物、白蛋白水平、贫血、糖尿病、总胆红素等13个自变量与丙戊酸钠血药浓度的相关性差异具有统计学意义,各变量的XGBoost重要性评分结果如表2所示。
表2 丙戊酸钠血药浓度预测模型中独立变量的重要性评分和相关性分析
2.3 丙戊酸钠血药浓度预测模型的构建
使用筛选的13项特征变量,基于XGBoost、GBDT、AdaBoost、CatBoost、LightGBM、RF、DT、Extra-Tree、LR、BPNN、KNN、SVR等12种机器学习算法建立丙戊酸钠血清药物浓度预测模型,其中GBDT模型的性能最优,准确率为0.987、召回率为0.987、精确率为0.987、F1值为0.987,结果如表3所示。为了进一步巩固模型的性能,使用五倍交叉法验证12种模型性能,结果显示,所有模型预测性能均有所下降,其中GBDT模型的准确率为0.637、召回率为0.637、精确率为0.635、F1值为0.626,结果如表4所示。
2.4 丙戊酸钠血药浓度预测模型的验证
使用测试队列对12种预测模型进行测试,GBDT模型测试结果为:准确率为0.617、召回率为0.617、精确率为0.610、F1值为0.593,说明构建的GBDT模型对丙戊酸钠血药浓度的预测性能较好,与训练队列相符合,模型的测试结果如表5所示。
表3 训练队列中12个预测模型的性能
表4 使用五倍交叉法验证12个模型的性能
表5 测试队列中12个预测模型的性能
3 讨论
为了提高丙戊酸钠治疗效果、降低不良反应,多国学者采用非线性混合效应模型方法,建立了丙戊酸钠PPK模型,用以指导个体化药物治疗方案[10-12]。但PPK模型缺乏药物作用机制的解释,并且需要根据给药方式和数据类型选择固定的药代动力学模型(一室、二室),在实际操作过程中往往受到数据限制[13-14]。相比PPK模型,机器学习不仅可以通过综合考虑患者生理特征、疾病进程以及药物治疗等准确地预测药物疗效,还可用于处理大数据集与复杂模型的筛选[15-16]。此外,相比同类研究仅构建了一种XGBoost模型而言,本文通过真实世界数据筛选了更多的特征变量,构建了12种预测模型,从而筛选出最优模型,更具有代表性[9]。
本研究通过机器学习方法基于多中心真实世界数据构建丙戊酸血药浓度多分类预测模型。机器学习是一门涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多领域的交叉学科,目前广泛应用于医学研究领域。相对于普通回归,机器学习模型的复杂性高、适用范围更广,更适用于处理高维度和非线性问题,泛化能力更强。XGBoost是集成学习算法中的一种,具有正则化能力、并行处理能力、特征重要性分析及非线性问题处理能力等,广泛地用于机器学习特征变量的提取。本研究基于双中心真实世界数据,采用XGBoost算法提取特征变量,并通过XGBoost、GBDT、AdaBoost、CatBoost、LightGBM、RF、DT、Extra-Tree等12种机器学习算法建立丙戊酸钠血清药物浓度预测模型,其中GBDT模型综合效能最优(准确率=0.987,召回率=0.987,精确率=0.987,F1值=0.987)。对预测模型采用五倍交叉验证及多中心外部数据测试验证,结果准确率为0.637、0.617,召回率为0.637、0.617,精确率为0.635、0.610,F1值为0.626、0.593,预测模型显示出良好的预测性能,具有较高的准确度、灵敏度和良好的泛化能力,但是本研究构建的12种模型在五倍交叉验证与测试队列验证时准确率、召回率、精确率、F1均大幅降低,存在过拟合现象,且调整正则化参数(L1、L2),过拟合现象改善不明显,因此在临床应用中存在一定的局限性。 本研究模型特征变量部分已经过其他学者验证[17-22],可靠性较高,模型显示出良好的可解释性。首先,在人口统计信息方面,多篇研究提示年龄、性别、体重及药物剂量是影响丙戊酸钠血清药物浓度的主要因素,可与本文研究相互印证[17-18]。其次,胆红素与血肌酐等指标与患者肝肾功能有关,胆红素升高的患者往往肝功能异常,影响丙戊酸钠代谢,血肌酐升高的患者肾功能减退,对丙戊酸钠的清除能力减弱,研究显示,总胆红素、直接胆红素升高是丙戊酸钠浓度剂量比(CDRV)升高的独立危险因素,提示肝功能障碍可使丙戊酸钠浓度升高,与本文结论一致,但心力衰竭、糖尿病、钾离子水平等影响丙戊酸钠血药浓度值的原因尚不明确[19]。最后,药物相互作用也是影响丙戊酸钠血药浓度的因素之一,多项研究显示联合使用碳青霉烯类药物可显著降低丙戊酸钠及其代谢产物的浓度,甚至部分研究将碳青霉烯类药物作为丙戊酸钠过量中毒的解毒剂[20-21],苯巴比妥可通过诱导加速丙戊酸钠代谢,降低其药物浓度[22],本文研究提示联合使用碳青霉烯类药物对丙戊酸钠血药浓度预测模型影响最大,苯巴比妥也可在不同程度上影响丙戊酸钠血药浓度值。
本研究首次发现与正常人群相比,贫血患者的丙戊酸钠血药浓度值显著降低,红细胞计数与血药浓度值成正相关,两者可作为特征变量预测丙戊酸钠血药浓度值。在616例训练集数据中232例贫血患者丙戊酸钠血药浓度(62.41±32.74)μg·mL-1及达标率(48.28%)均显著低于384例非贫血患者血药浓度(74.14±29.43)μg·mL-1与达标率(59.64%)。由于未查询到贫血影响丙戊酸钠血药浓度的机制,笔者猜测其可能通过某种因素,间接影响丙戊酸钠血药浓度,因此分析了贫血与其他变量的关系,发现本文纳入的贫血患者血清白蛋白水平(34.59±4.81)g·L-1显著低于非贫血患者(38.88±5.28)g·L-1,而丙戊酸钠血清蛋白结合率高,低蛋白血症患者血清游离丙戊酸钠增多,清除加快,可能对丙戊酸钠血药浓度产生影响,但仍需进一步研究。
综上所述,本研究依据多中心真实世界的数据,构建了可预测丙戊酸钠血药浓度范围的机器学习预测模型,模型有良好的准确性、适用性及泛化能力,对于指导临床丙戊酸钠个体化精准用药具有较强的参考价值。尽管如此,研究也有不足,构建模型在测试队列中各项性能均有所下降,可能与本研究未纳入患者的遗传信息作为特征变量且数据量较少有关,因此尚需多中心、大样本量的数据进一步研究、优化。
基金资助:西安国际医学中心医院青年课题(No.2023QN05);咸宁市中心医院院级科研项目(No.2022XYB033);咸宁市自然科学基金项目(No.2021ZRKX036);
文章来源:徐金军,洪术霞,史金平,等.基于多中心真实世界数据构建丙戊酸钠血药浓度预测模型[J].中南药学,2025,23(08):2433-2438.
分享:
阿维鲁单抗是一种靶向程序性死亡受体配体1(programmeddeath-ligand1,PD-L1)单克隆抗体,可结合PD-L1并阻断PD-L1及其程序性死亡受体1(programmeddeath-1,PD-1)和B7.1之间的相互作用,导致免疫反应(包括抗肿瘤免疫反应)的恢复。阿维鲁单抗[3]已被证明具有适应性和先天性免疫功能。
2025-08-29在药品检测领域,数据可靠性就是生命线,精准的检测结果倚仗设备稳定无误运行,而完备的固定资产档案恰是追溯设备性能、校准历史的关键依据[1]。一旦档案缺失或混乱,检测数据的准确性便会遭受质疑,药品质量评定也随之失去稳固基石。同时,实验室高效运转需要合理调配资源,精准的档案能辅助管理者知悉设备闲置情况,及时安排共享使用,避免资源浪费。
2025-08-26丙戊酸(valproic acid,VPA)是一种短链脂肪酸,可通过抑制γ- 氨基丁酸(GABA)转氨酶及钠离子和 L 型钙离子通道发挥药理活性,不仅被广泛用于治疗癫痫发作和双相情感障碍,还在心血管、糖尿病、肾脏等疾病中发挥作用 。丙戊酸钠的治疗作用和不良反应与其血药浓度有关,其治疗药物监测范围为 50 ~ 100 mg•L - 1。
2025-08-22随着女性群体对自身生理健康和心理健康意识水平提高,社会对更年期女性生存质量的逐渐重视,更年期女性的健康需求、情绪障碍和生活质量逐渐得到关注。研究发现,更年期女性存在自主神经紊乱症状,导致性激素水平和神经递质因子水平发生变化,从而引起焦虑、抑郁等情绪障碍,严重影响女性的生活质量。
2025-08-13环孢素是临床常用的一种钙调素类免疫抑制剂,常用于异基因造血干细胞移植(allogeneichematopoieticstemcelltransplantation,allo-HSCT)术后移植物抗宿主病(graft-versus-hostdisease,GVHD)的预防,环孢素的应用合理性是影响移植物存活的重要因素之一。
2025-07-26结核病是全球面临的重大公共卫生挑战,广东省则为人口大省和流动人口聚集地,结核病防控任务尤为艰巨[1]。抗结核药品质量直接关系到治疗效果和患者安全,劣质药品不仅可能导致治疗失败、延长病程,更可能诱发耐药性,给患者和社会带来严重危害[2]。近年来,药品质量安全事件时有发生,暴露出医院药品质量控制体系的薄弱环节[3]。
2025-07-252019年10月20日,中共中央、国务院发布并实施《关于促进中医药传承创新发展的意见》,为中药制剂的创新发展注入了澎湃活力。但同时,中药制剂的临床用药安全性问题也日益突出,2021年全国药品不良反应(ADR)监测报告显示,13%ADR为中药制剂引起,其中严重ADR占5.1%[1]。
2025-07-23T2DM是目前尚无根治方法的糖代谢异常综合征,是因遗传、体力活动不足等因素导致胰岛素分泌不足或胰岛素利用不足,使得血糖持续升高,若未及时控制血糖水平,可影响血脂代谢能力和蛋白质代谢能力,诱发心血管疾病,造成机体不可逆损伤。二甲双胍不仅能降低胰岛素抵抗,提高胰岛素敏感性,还能减少肝脏葡萄糖输出,改善血糖水平。
2025-06-16世界肥胖联盟2024年的研究数据显示:2020年全球约有8.1亿成年人患有肥胖症,预计到2030年患肥胖症的人数将达到12.5亿。肥胖会增加2型糖尿病(dia‐betesmellitustype2,T2DM)、心血管疾病、生殖系统疾病等的发生风险,降低生活质量,严重者可增加死亡风险。替尔泊肽是一种胰高血糖素样肽1(glucagon-likepeptide-1,GLP-1)/葡萄糖依赖性促胰岛素多受体激动剂。
2025-05-19抗体偶联药物(AntibodyDrugConjugate,ADC)通过连接子(Linker)将小分子化合物(payload)偶联至靶向性抗体(Antibody)。自2000年第一个ADC上市以来,全球已有12种ADC获批上市。国内已有2个进口、1个国产ADC获批上市[2],另有数百个ADC正在进行临床试验。为了平衡ADC的药效和毒副作用。
2025-04-16人气:18216
人气:17588
人气:17198
人气:16265
人气:15000
我要评论
期刊名称:中南药学
期刊人气:5370
主管单位:湖南省食品药品监督管理局
主办单位:湖南省药学会,湖南省药学会
出版地方:湖南
专业分类:医学
国际刊号:1672-2981
国内刊号:43-1408/R
邮发代号:42-290
创刊时间:2003年
发行周期:月刊
期刊开本:大16开
见刊时间:1年以上
影响因子:1.392
影响因子:0.709
影响因子:1.360
影响因子:0.840
影响因子:1.980
您的论文已提交,我们会尽快联系您,请耐心等待!
你的密码已发送到您的邮箱,请查看!