91学术服务平台

您好,欢迎来到91学术官网!业务合作:91xueshu@sina.com,站长邮箱:91xszz@sina.com

发布论文

论文咨询

基于遗传算法优化C-LSTM模型的心律失常分类方法

  2024-03-06    14  上传者:管理员

摘要:结合遗传算法全局寻优的特点提出一种GC-LSTM模型,该模型通过特定遗传策略的遗传算法自动迭代搜寻C-LSTM模型最佳超参数配置。利用遗传迭代结果配置模型,并按照医疗仪器促进协会制定分类标准在MIT-BIH心律失常数据库上进行验证。经过测试,本文提出的GC-LSTM模型在分类准确率(99.37%)、灵敏度(95.62%)、精确度(95.17%)、F1值(95.39%)上相较于手动搭建模型均有所提升,且与现有主流方法相比亦具备一定优势。实验结果表明该方法在避免大量实验调参的同时取得较好的分类性能。

  • 关键词:
  • ECG
  • GC-LSTM模型
  • 心律失常分类
  • 超参数
  • 遗传算法
  • 加入收藏

随着社会经济的发展,人口老龄化与城镇化进程的加速,居民不健康的生活方式日益突出,心血管疾病发病率持续上升。据统计,中国因心血管疾病死亡的人数占城乡居民死亡人数比例超过40%[1]。因此,重视并加强心血管疾病的预防、诊断及治疗显得尤为重要。心律失常是最常见的心血管疾病之一,通常是指心律起源部位、心搏频率、节律以及冲动传导等任一异常。心电图(Electrocardiogram,ECG)作为一种表征人体心脏状况的生理电信号,在发生心律失常时,ECG信号会呈现出具有反常形态和节律的波形[2]。因此,在临床上医生根据ECG诊断病人是否患有心血管疾病。但由于心电信号具有高度非线性且为毫伏量级的信号,故人工诊断易出现误诊和漏诊的情况。而基于计算机辅助诊断的心电信号分析系统可有效缩短诊断时间与提升诊断准确度。

近些年随着人工智能技术的发展,出现了许多基于机器学习[3,4,5,6]和深度学习[7,8,9,10,11,12]的心律失常分类方法。基于深度学习的分类算法在生物医学信号分类系统中应用越发广泛并取得良好的效果,其中大多数方法采用CNN、LSTM或它们组合而成的CNN-LSTM网络[6]。比如Kiranyaz等[7]最早将一维卷积(1D-CNN)用于心律失常分类,该模型由3层卷积层和2层全连接层构成,且卷积模块均采用较小的卷积核进行运算,最终在MIT-BIH数据库中实现99%的心室异常节拍分类准确率。Ihsanto等[8]提出一种21层的深度可分离卷积神经网络对ECG进行分类,该模型仅采用MIT-BIH心律失常数据库中22%的数据进行训练,其余78%数据用于16类别分类测试,最终达到99.8%的平均准确率。Rajpurkar等[9]建立一个34层的单通道残差网络用于单导联心电信号的心律失常分类系统,使用超规模数据量的心电信号数据集训练网络。在心律失常10分类任务中,该模型出现了超过专家诊断准确率的情况。Yildirim[10]使用4种不同类型的LSTM网络对MIT-BIH数据库中ECG进行5分类,主要验证带有小波序列的双向LSTM网络分类性能优于LSTM和双向LSTM,且达到99.39%的分类准确率。Lu等[11]提出一种基于CNN-LSTM网络模型的心律失常分类算法,该设计利用深度CNN提取ECG信号的形态学特征,然后通过LSTM学习形态学特征的时间相关性,深入挖掘内在特征。实验结果表明,该方法显著缩短分类时间,分类准确率达96%以上。Madan等[12]将1D的ECG信号转换为2D比例图像,进行噪声滤除和特征提取,结合二维卷积神经网络和LSTM网络提出一种2D-CNN-LSTM模型的心律失常分类方法,该方法极大提升了分类模型的平均灵敏度和特异性。

虽然上述模型在心律失常分类问题上达到很高的分类准确度,但模型的分类性能高度依赖于网络结构和超参数设定[13]。传统形式的模型搭建依赖于研究者的经验以及对数据特性的认识程度,同时还需大量的实验才能获取最终模型。这不仅会消耗大量时间,且不能保证模型达到最优。因此近些年陆续有关于优化深度学习模型的方法被提出。钱龙等[14]提出一种基于遗传算法(Genetic Algorithm,GA)优化LSTM网络的胎儿心电信号提取方法,利用GA求取LSTM网络的部分超参数,得到网络的最优组合,相较于未经优化的LSTM模型在准确率、敏感度、精确度、F1值上均有超过2%的性能提升。Li等[15]提出一种基于GA优化反向传播神经网络权重值的方法,用于ECG信号的6分类任务,在分类准确率和精确度上分别实现1.67%和1.23%的提升。Maghawry等[16]提出一种基于GA优化的CNN网络权重值的方法,相较于未优化的CNN网络,精确度提升2.06%,准确率提升4.42%。但上述方法均只采用单种模型,无法同时关注到ECG信号的时间与空间特性。

因此,本文提出一种基于GC-LSTM模型的心律失常分类方法。首先对心电信号进行小波阈值变换去噪与心拍分割;其次搭建CNN与LSTM网络的组合模型C-LSTM[17]作为心律失常分类初始模型,对心电信号在形态和时序层面的特征进行深入提取,提升模型分类性能;然后选择模型中最重要的几个超参数组成遗传迭代的个体,将生成的个体分别代入初始模型进行训练,训练完成后采用特定遗传策略对当前种群进行迭代优化,直到满足模型性能需求后退出迭代;最后利用经过预处理后的心拍数据对遗传迭代所得最优配置下的C-LSTM模型进行训练与测试,得到一个遗传迭代设定范围内的最优心律失常分类模型。


1、GA优化C-LSTM模型


1.1 C-LSTM模型

由CNN和LSTM组合而成的C-LSTM模型首次在文献[17]中被提出,且将其用于文本情感和问题分类,其结构如图1所示。通过1D-CNN提取词语中的特征,并将提取到的特征序列送入LSTM模型中以学习语句中的长程依赖性。经验证,该模型的性能优于单一的CNN或LSTM模型。

图1 C-LSTM模型结构  

1.2 GA

GA由美国Holland教授于1960年基于达尔文进化论提出,是一种针对不同问题选择不同遗传算子不断迭代进化的群智能优化算法[18]。相较于其他优化算法,GA可实现对解空间的全局搜索,通过特定的选择、交叉、变异策略实现种群的迭代,克服易陷入局部最优解的缺点。传统遗传算法步骤为:(1)确定问题参数:指定需要遗传算法搜寻的参数;(2)编码:对目标参数进行编码,其中常用编码方式有二进制、格雷码、实数编码等方式;(3)种群初始化:随机生成若干种群;(4)个体适应度评价:根据选定适应度函数,对生成的种群依次进行适应度计算;(5)选择、交叉、变异:依据适应度对个体择优录取,并进行交叉、变异操作获取更优解;(6)群体更新:待更新个体数量达到目标时完成群体更新,进入下一次迭代;(7)当满足退出条件时,遗传迭代结束。

1.3 GA优化C-LSTM模型

本文采用GA对C-LSTM模型的结构参数进行优化,优化流程主要分为C-LSTM模型搭建与训练和GA迭代优化两个部分。其中C-LSTM部分逐个将遗传迭代后的个体用于搭建分类网络,并采用同一组心电数据进行模型训练,训练完成后输出模型的平均分类准确率作为该个体适应度。GA迭代优化模块将根据每个个体适应度通过对应遗传策略生成性能更优的种群。整体算法流程如图2所示,基本思路如下:(1)准备模型训练所需心电信号数据,并构建1D-CNN、LSTM、全连接层函数;(2)确定卷积层数、全连接层数、卷积核大小和个数、LSTM以及全连接层神经元个数为待优化参数,设定每个参数遗传迭代搜寻范围,具体设定如表1所示,同时为了提升遗传迭代速度,本文采用可变长实数编码方式对个体进行编码,每个个体基因数控制在6~14个;(3)设定GA所需种群大小、交叉率、变异率等参数如表2所示,其中种群大小为20,交叉率设定为50%,变异率设定为10%;(4)初始化种群,依照设定种群大小和优化参数范围随机初始化生成20个个体,组成初代种群;(5)进行初始化个体层级配置,逐个完成初始化个体训练,并得到训练后模型的平均分类准确率作为该个体适应度;(6)选择,为了保证GA的收敛速度和种群中个体基因的优良性,本文采用精英保留和轮盘赌方式相结合的选择策略,首先将该种群内适应度最高的个体选中,然后剩余个体采用轮盘赌方式执行选择;(7)对选择出的个体执行复制、交叉和变异。复制是为了保证种群基因的优良性,交叉将父代基因进行重组生成下一代个体,变异是为了引入当前种群外的基因,防止迭代进入局部最优解,由于优化参数中包含层级参数,层级参数的变化会引起个体基因数的变化,因此只针对非层级参数执行交叉和变异,同时为了保证不破坏层级结构属性,只执行相同层级参数单点匹配交叉方式,具体交叉和变异方式如图3所示;(8)将执行复制、交叉、变异后的个体组成新种群,并将该类个体逐个对模型进行层级参数配置,进行训练得到个体适应度;(9)以步骤(5)~(8)进行循环,在完成50次迭代后结束循环,并输出迭代过程中适应度最高的个体,用于后续对比实验。

图2 优化流程    

表1 优化参数   

表2 GA参数设置

图3 交叉、变异策略   

1.4 最终模型结构

利用经过GA优化后输出的最优个体搭建本文的心律失常分类模型,具体模型结构如图4所示。模型主要由输入层、卷积层、最大池化层、LSTM层以及全连接层组成。其中输入层将心拍信号输入分类网络;卷积层提取心拍信号中的形态特性;最大池化层对卷积层提取到的特征进行特征降维,减少运算量的同时防止网络过拟合;LSTM提取心电信号的时序特性;全连接层用于整合前面网络所获取的特征,并输出心拍类型。

模型结构详细参数如表3所示。模型主要包含3层一维卷积神经网络、3个最大池化层、1个LSTM层、2个全连接层。卷积神经网络均采用Re LU作为激活函数,卷积核个数分别为16、42、35,卷积核大小分别为37、18、29;最大池化层均采用大小为3×1的池化单元,以步长为2进行移动;LSTM层包含126个LSTM单元;第一个全连接层包含85个神经元与LSTM层进行连接,并通过ReLU函数输出;最后通过大小为4,激活函数为Softmax的全连接层进行类型输出。


2、实验设置与结果分析


2.1 数据集与预处理

本文实验数据来源于MIT-BIH心律失常数据库(MIT-BIH Arrhythmia Database)[19],该数据库中包含48条采样频率为360 Hz且超过30 min的双通道动态心电信号记录,其中由于MLII导联方式的数据经过修正,因此本文只采用MLII导联方式获取数据进行实验。原始心电信号包含工频干扰、基线漂移和肌电干扰等噪声源所引入的噪声,这些噪声会影响ECG特性[20]。本文采用基于Daubechies4为小波基的小波变换对心电信号进行8层分解,并通过Visu Shrink阈值去噪后重构的方式实现噪声滤除。然后对滤除噪声后的心电信号进行心拍分割,由于该数据库中的心电信号均由心脏领域权威专家在每个心拍的R波位置进行心拍类型标注,因此可直接在标注位置进行心拍分割。对于每条心电信号在R波位置前取100个样本点,向后取150个样本点组成一个完整心拍。将经过预处理的心拍数据,按照医疗仪器促进协会(Association for the Advancement of Medical Instrumentation,AAMI)标准进行重新分类为N、S、V、F、Q 5类,由于Q类型为未知类型心拍且数量较少,因此本文只针对N、S、V、F 4类心拍进行分类研究,具体分类详情如表4所示。

图4 最终模型结构图     

表3 最终模型详细参数    

表4 心拍分类详情  

2.2 评估实验

为了验证提出的GA优化C-LSTM模型结构的有效性。本文通过人工调参方式搭建两组C-LSTM模型的对比网络,对比网络中层级参数均采用2的指数形式进行设置。且对比模型的层数以本文最终模型为基准,设置更深的网络C-LSTM1与更浅的网络C-LSTM2,具体参数如表5与表6所示。其中卷积层与非最后一层全连接层均采用ReLU作为激活函数,最大池化层采用与最终模型相同结构,最后的输出层采用Softmax作为激活函数。搭建好两组模型后,将经过预处理后的心电信号按照6:2:2的比例划分训练集、验证集以及测试集,将每个模型采用同一批数据作为训练集、验证集和测试集。且每个网络均采用Adam优化器进行训练,学习率设置为0.001,网络批处理大小为128,训练次数为100。在同等训练条件下,对3组网络进行性能测试,利用测试结果进行模型性能对比。  

表5 C-LSTM1模型详细参数   

表6 C-LSTM2模型详细参数 

2.3 评估指标

为了评估本文所提模型的分类性能,使用准确率(Acc)、灵敏度(Sen)、特异性(Spe)、精确度(Ppv)以及F1值5个参数作为模型分类性能评估指标,各参数计算方式如式(1)~式(5)所示:

其中,TP表示正确分类的阳性样本数;TN表示正确分类的阴性样本数;FP表示错误分类的阳性样本数;FN表示错误分类的阴性样本数。

2.4 实验结果

模型训练损失值与准确率如图5所示。从图中可以看出,3组网络均在40次训练后收敛,且GC-LSTM模型收敛时的损失值明显低于对比网络,准确率均高于对比网络。完成模型训练后对模型进行测试,各网络测试集评估结果如表7所示。从表中可以看出,相较于C-LSTM2,GA-CNN模型的分类性能有明显优势,这是由于C-LSTM2模型层级设置过于简单,模型学习能力不足以学习到心电信号中复杂且微弱的特征而导致分类性能差;C-LSTM1虽然在F类型心电信号具有更好的特异性与精确度,但其他类型分类性能均低于GC-LSTM模型。对于GC-LSTM模型,在F类型心电信号分类性能明显低于其他类型心电信号,这是由于该类型心电信号样本较少,模型能学习到的特性有限。具体分类详情如图6所示。因此,通过对比结果可知,采用手动调参所获取的模型性能在分类性能上具有极大的不确定性,易出现因模型设置过于简单而学习能力不足进而导致模型分类性能不佳的情况,也易出现模型设定冗余浪费计算资源和时间的同时,不一定能获得最佳性能。若想在对比模型基础上微调来获取最终模型,则需要不断微调实验,这样也会导致大量时间的消耗。而采用遗传算法优化模型结构,可自行得到设定范围内的最佳模型结构,省略参数微调的阶段。

图5 模型训练性能对比图

2.5 与其他方法对比分析

将本文模型与当前主流心律失常分类模型进行性能对比,对比结果如表8所示。所选取对比文献均采用MIT-BIH心律失常数据库中的心电数据并按照AAMI分类标准进行分类性能验证。文献[21]采用CNN网络进行分类,采用数据合成方式将每种心拍扩充至90 592个,经过该方式平衡后准确率可达94.03%,但在未进行数据平衡时,该网络分类准确率仅89.3%;文献[22]在CNN基础上添加ELM分类器进行心电信号特征整合与类型判断,有效提升分类性能;文献[23]采用RNN网络在非平衡数据集上实现94.72%的平均分类准确率;文献[24]采用CNN与BiLSTM组合模型进行分类,虽然分类准确率较高,但其他分类性能不佳;文献[11]采用C-LSTM模型进行分类,在灵感度、精确度、F1值上取得较好效果,但整体分类准确率偏低;文献[16]采用遗传算法优化CNN模型权重参数,但该模型的层级设置过于简单,导致整体分类性能较差。本文采用遗传算法自动搜寻C-LSTM模型结构参数,省略模型手动调参的过程,且在整体分类准确率和F1值上均优于现有主流算法,分类敏感度和精确度也高于大多数方法,证明本文方法的有效性和可实施性。 

表7 各网络测试集评估结果(%)  


3、结论


本文针对ECG心律失常分类提出一种基于遗传算法优化的C-LSTM模型,充分利用GA全局寻优的特性来自动迭代搜寻C-LSTM最佳模型结构。实验结果表明,相较于传统人工调参,该方法只需设定几个简单的GA参数即可自动确定设定范围内的最优模型结构,且可极大缩减模型搭建时间。最终本文提出的理论模型达到99.37%的整体分类准确率、95.62%的灵敏度、95.17%的精确度以及95.39%的F1值,相较于现有方法具备更好的整体分类性能。但是,遗传算法优化模型结构也存在参数设定依赖于经验值以及遗传迭代速度依赖于硬件性能等缺陷,且其参数设定对最终解的质量具有很大的影响,因此还需进一步深入研究。

图6 各网络混淆矩阵对比图    

表8 本文方法与已发表文献分类性能比较(%)  


参考文献:

[1] 中国心血管健康与疾病报告编写组.《中国心血管健康与疾病报告2021》要点解读[J].中国心血管杂志, 2022, 27(4):305-318.

[14] 钱龙,王文波,陈贵词,等.一种基于遗传算法优化的长短时记忆网络胎儿心电信号提取方法[J].生物医学工程学杂志, 2021, 38(2):257-267.


基金资助:重庆市科技局产业化项目(CSTC2018JSZX-CYZTZX0211,CSTC2018JSZX-CYZTZX0048);


文章来源:王巍,丁辉,夏旭等.基于遗传算法优化C-LSTM模型的心律失常分类方法[J].中国医学物理学杂志,2024,41(02):233-240.

分享:

91学术论文范文

相关论文

推荐期刊

网友评论

加载更多

我要评论

中华心血管病杂志

期刊名称:中华心血管病杂志

期刊人气:4435

期刊详情

主管单位:中国科学技术协会

主办单位:中华医学会

出版地方:北京

专业分类:医学

国际刊号:0253-3758

国内刊号:11-2148/R

邮发代号:2-44

创刊时间:1972年

发行周期:月刊

期刊开本:大16开

见刊时间:1年以上

论文导航

查看更多

相关期刊

热门论文

【91学术】(www.91xueshu.com)属于综合性学术交流平台,信息来自源互联网共享,如有版权协议请告知删除,ICP备案:冀ICP备19018493号

400-069-1609

微信咨询

返回顶部

发布论文

上传文件

发布论文

上传文件

发布论文

您的论文已提交,我们会尽快联系您,请耐心等待!

知 道 了

登录

点击换一张
点击换一张
已经有账号?立即登录
已经有账号?立即登录

找回密码

找回密码

你的密码已发送到您的邮箱,请查看!

确 定