91学术服务平台

您好,欢迎来到91学术官网!业务合作:91xueshu@sina.com,站长邮箱:91xszz@sina.com

发布论文

论文咨询

急性冠脉综合征风险预测模型的方法学探讨

  2021-12-11    222  上传者:管理员

摘要:为了降低急性冠状动脉综合征的疾病发生率、改善患者预后和疾病负担,早期识别和预测急性冠状动脉综合征的发生风险是有效手段。通过分析急性冠状动脉综合征风险预测模型的应用进展情况,建立专病数据库,构建风险预测模型。对传统回归模型和多种机器学习方法进行分别建模,通过相关指标综合评价比较模型,可选择最优预测模型。预测模型可在临床实践中进行前瞻性验证,并尝试在临床上推广,为开展临床研究奠定理论基础。

  • 关键词:
  • 人工智能
  • 介入治疗
  • 急性冠脉综合征
  • 机器学习
  • 风险预测模型
  • 加入收藏

1、引言


急性冠状动脉综合征(ACS)是一种严重的心血管疾病,可导致患者的部分心肌功能异常,甚至是死亡[1],包括ST段抬高型心肌梗死(STEMI)、非STEMI(NSTEMI)和不稳定型心绞痛。急性冠状动脉综合征具有较高的致死、致残率[2]。我国每年约有250万人受ACS影响,约30%的人一生中存在ACS的发生风险[3]。ACS给患者带来了严重的疾病与经济负担。2014年共有500,946例患者接受了冠脉介入治疗,总的住院费高达207.07亿元[4]。对ACS患者进行准确的危险分层,早期识别急性冠状动脉综合征及其危险程度,是制定治疗决策、有效管理患者、改善患者预后的重要前提[5]。虽然人工智能在急性冠脉综合征应用上开展了部分尝试,但是还需要进一步深入的研究。本文主要对ACS风险预测模型的应用进展以及机器学习建模方法进行阐述,为进一步构建ACS风险预测模型,助力临床决策和患者管理奠定基础。


2、预测模型研究现状


传统的评分工具对ACS风险的评估存在一定的局限性,因此在临床上的应用受到了限制。GRACE评分广泛应用于ACS患者疾病风险的初始评估[6],但GRACE评分在首次医疗接触时无法较快的获得评分所需的某些变量,限制了其在临床上的推广[7]。PREDICT评分于1999年提出,主要用于预测ACS患者出院后的远期死亡风险[8]。但PREDICT评分依赖于出院诊断,且评分细则非常复杂,不适用于早期、快速评估,而适于患者的出院前评估[8,9,10]。TIMI评分可用于早期评估ACS患者的30天死亡风险[9,11,12],但TIMI评分模型出自临床试验的特定人群,不一定适于普通患者,且不适于未接受造影的UA/NSTEMI患者。此外,TIMI评分未纳入对预后有重要意义的有创或无创性检查指标,可能会影响其预测精确性。AMIS评分模型于2008年提出,操作简单。但是,AMIS模型需要借助特殊工具,且计算公式尚未普及[9]。此外,国际上应用于临床的ACS风险评估方法还有很多,适用的临床情况各有不同,但均存在一定的局限性,临床应用受到了限制[9,13]。

近年来,人工智能(AI)发展迅速,许多发达国家将其上升至国家战略,我国也在2017年印发了《新一代人工智能发展规划》,推广应用人工智能治疗新模式,建立快速精准的智能医疗体系。目前,人工智能在ACS诊断与风险预测中的应用尚处于探索阶段。Yang等人采用自然语言处理技术检测冠状动脉疾病相关危险因素,跟踪其进展情况,用于辅助冠脉疾病的早期治疗和预防[14]。采用机器学习算法构建的预测模型可有效预测中国ACS患者3年死亡风险(AUC=0.768)[15]。研究发现,用人工神经网络算法建模可有效辅助临床医生诊断急诊中疑似ACS的患者(AUC=0.8)[16]。PengweiHu等研究发现,基于38家城市和农村不同等级的医院的电子病历数据,使用机器学习方法建模可有效预测ACS患者发生MACE的风险[17]。


3、风险预测模型构建


3.1 数据库搭建

3.1.1 参考标注与制定方法

临床数据交换标准协会(CDISC)是一个全球性、开源、多学科的非盈利组织。其主要目标是提高药物研发的效率。在临床试验中其主要的两套数据标准分别为研究数据制表模型(SDTM)和分析数据模型(ADaM)。在本研究的数据库设计与搭建过程中,充分参考、采纳了CDISC相应的数据标准,并根据ACS涉及到的专病变量,结合临床科研的实际需求,在原CDISC标准基础上建立了一套符合本研究实际情况与特色的数据标准规范,从而提高整个专病数据库在数据收集、使用、分析过程中的规范性,进而提高数据质量,并以此提高科研成果转化的效率。

在ACS专病数据库的建立过程中,主要参考并采用了SDTM和ADaM标准。SDTM包含三种基本数据标准结构,分别是事件、干预和结果,以及若干个特殊的数据结构域,如人口学数据。ADaM主要是以数据统计分析为导向的数据标准,定义了ADSL、BDS和ADAE三种数据结构[18]。从数据流的角度来看,SDTM为原始数据,在其基础上进行变量衍生形成ADaM,在ADaM基础上再进行数据分析。在本文的专病库建立过程中,根据L1、L2、L3(L1为结构化变量或手工录入变量、L2为需要通过NLP技术进行后结构化的变量、L3为需要多个字段进行公示或逻辑运算得到的变量)的定义规则,从医院各个信息系统用ETL(extract-transformload)技术进行数据获取,故在这个过程中并未区分从SDTM到ADaM的这个过程。因此在数据域和数据标准(包括变量命名、长度、格式以及变量值域等)的设置中,将SDTM和ADaM进行了一定的融合。

3.1.2 纳入与排除标准的设定

研究拟纳入2012年6月-2021年10月期间在福建省立医院急诊科接受治疗的患者。纳入标准包括:(1)年龄大于18岁;(2)有完整的病历记录和随访记录;(3)因胸痛入急诊就诊的患者。排除标准:(1)入院后24小时内死亡的患者;(2)合并其他重度疾病,如未经治疗的室性心动过速,严重的心力衰竭,无法控制的高血压或低血压、或患预期寿命不足1年;(3)心肌病、心瓣膜病。

3.1.3 变量集/专病数据集设计

依据医院ACS专病数据情况,搜集国内外ACS疾病数据模型并基于数据标准进行专病数据集整理,后期再基于所构建的专病数据集从院内各数据系统中抽取相应的数据。

本文所构建的ACS专病数据集包含患者的基本信息、就诊记录、诊断记录、现病史、既往病史、既往用药情况、嗜好品信息、过敏史、家族史、生命体征、体格检查、实验室检查、心电图、手术治疗、手术记录、用药情况、术后观察、并发症/重要医学事件、随访基本信息和死亡信息等患者变量域。

3.1.4 患者数据集成入库

在专病数据集构建完成后,采用ETL技术对医院信息系统(HIS)、实验室信息系统(LIS)、电子病历(EMR)、放射信息管理系统(RIS)等系统的源数据进行抽取,转化为数据仓库。ETL即数据抽取、数据转换和数据加载,先将分布的、结构不同的数据源中的数据抽取到中间交换数据库,再进行数据的清洗、转换和集成操作,最后加载到目标数据库[19,20]。

针对院内的数据,研究人员使用备份库进行数据集成。针对业务系统实时数据采集,使用数据库复制技术对生产系统数据库业务数据表进行复制。在建立的复制库上进行数据抽取,从而保证对生成系统数据库的性能无影响。

本文在业务系统中将专病数据集中的变量进行抽取、转换、加载、清洗后,再通过自然语言处理技术将非结构的文本进行后结构化处理后,搭建了一套ACS专病数据库。目前专病库正在持续收集患者数据。

3.2 模型构建方法

模型构建采用传统回归模型和多种机器学习方法进行分别建模,然后通过模型间的比较确定最终模型。

3.2.1 传统回归法构建模型

第一步采用单因素Cox回归分析筛选ACS的潜在危险因素,基于Cox比例风险模型采用逐步回归法或Lasso法进一步筛选风险因素。逐步回归法将基于变量入选和排除的标准(初步拟定α进入=0.05,α排除=0.1)和基于模型拟合情况进行变量筛选。Lasso回归分析将采用10折交叉验证方法,选择模型误差最小时的压缩系数(λ),然后依据λmin进行变量筛选。将多种方法筛选出来的影响因素分别基于Cox回归构建预后模型,然后对前一步所构建的多个预后模型分别在内部验证集和训练集中进行评价,确定最终模型。

本文使用模型区分度(Discrimination)和校准度(Calibration)筛选出最优的模型,评价指标包括:(1)赤池信息量准则(AIC):反应模型的拟合情况,值越小,模型拟合情况越好。(2)C-index值:HarrellC-index值反映模型的区分度,越高越好。(3)R2:评估模型拟合情况。(4)校准度:采用Bootstrap进行1000次重抽样,评估模型校准度,主要采用Calibration图和Hosmer-Lemeshowχ2统计量进行展示。时间依赖性受试者工作特征曲线(ROC):通过时间依赖性ROC评估ACS发生风险的预测效果,以ROC曲线下面积(AUC)为评价指标。综合上述指标评价获得最终的风险预测模型。

3.2.2 机器学习法构建模型

考虑数据库包含的变量多,并且变量间关系复杂,传统回归模型拟合效果可能不佳,本文拟采用机器学习(ML)方法进行模型构建。可初步考虑的机器学习方法包括:随机森林(RF)、支持向量机(SVMs)、随即优化(RO)、多层感知神经网络(MLPNN)、深度学习(DL)等。对于数据库中的部分文本变量拟采用naturallanguageprocessing(NLP)进行处理。在建模过程中探索更优的模型判别能力,拟考虑多种模型融合,以及不同参数调整,从而提升模型最后的预测效果。建模过程中结局考虑ACS的发生情况,利用训练集数据进行十折交叉验证构建模型,并在验证集中进行应用,寻找各机器学习方法建模过程中的最优模型。

3.2.3 模型评价

将传统回归法构建模型和多种机器学习方法构建模型分别在训练集和验证集中进行预测,采用正确预测率、错判率、灵敏度、特异度、阳性似然比、阴性似然比、ROC曲线下面积等指标对模型的ACS风险预测能力进行综合评价比较,根据模型的表现确定最终预测模型。

3.2.4 与现有模型进行评价比较

将确定的模型和目前现有的风险评估工具/量表(或模型),在队列数据中进行评估比较,评价指标为AUC、AIC值、C-index值、R2、Calibration等,进一步对所构建模型进行评估。

3.2.5 预后评价系统形成

采用列线图(Nomogram)对所构建模型进行图形化展示,根据图形展示可以直观评估受试者ACS发生的概率。


4、讨论与分析


本文阐述了ACS风险预测的相关研究进展,以及基于机器学习构建ACS风险预测模型的方法学。在设计数据集的时候,需要围绕专病诊疗路径,这样可确保数据的完整性和可用性,也为后期在其他病种上的扩展应用提供了参考借鉴意义。福建省立医院通过专病数据库的搭建,医生可在发现患者满足入组条件时,即可开始录入患者的临床数据,而无需后期补录。搭建专病数据库可加快数据收集的速度和效率,增加科研产出。

下一步,将基于上述的机器学习模型构建方法搭建ACS风险预测模型,并在临床实践中进行前瞻性验证,以确定最佳的ACS风险预测模型,并尝试在临床上推广。


参考文献:

[2]高润霖.我国急性冠状动脉综合征治疗的现状及存在问题[J].中华医学杂志,2009,89(36):2521-2522.

[4]陈伟伟,高润霖,刘力生,等.《中国心血管病报告2015》概要[J].中国循环杂志,2016,31(6):521-528.

[9]郭远林.急性冠状动脉综合征风险评估方法学进展[J].心血管病学进展,2015,036(006):681-686.

[13]孔祥溢,王任直.人工智能及在医疗领域的应用[J].医学信息学杂志,2016,37(11):2-5.

[19]薛晶.基于数据仓库的统计库的设计和实现[硕士学位论文][J].中国科学院研究生院(计算技术研究所),北京,2000.

[20]廖剑岚.决策支持系统中的数据挖掘与OLAP--数据仓库环境下的信息分析[硕士学位论文][J].华东师范大学,上海,2002.


文章来源:连扬鹏.急性冠脉综合征风险预测模型的方法学探讨[J].福建电脑,2021,37(12):60-63.

分享:

91学术论文范文

相关论文

推荐期刊

网友评论

加载更多

我要评论

心血管康复医学杂志

期刊名称:心血管康复医学杂志

期刊人气:1819

期刊详情

主管单位:福建省科学技术协会

主办单位:福建省康复医学会,中国康复医学会

出版地方:福建

专业分类:医学

国际刊号:1008-0074

国内刊号:35-1193/R

邮发代号:34-83

创刊时间:1992年

发行周期:双月刊

期刊开本:大16开

见刊时间:10-12个月

论文导航

查看更多

相关期刊

热门论文

【91学术】(www.91xueshu.com)属于综合性学术交流平台,信息来自源互联网共享,如有版权协议请告知删除,ICP备案:冀ICP备19018493号

400-069-1609

微信咨询

返回顶部

发布论文

上传文件

发布论文

上传文件

发布论文

您的论文已提交,我们会尽快联系您,请耐心等待!

知 道 了

登录

点击换一张
点击换一张
已经有账号?立即登录
已经有账号?立即登录

找回密码

找回密码

你的密码已发送到您的邮箱,请查看!

确 定