首页 > 论文范文 > 医药卫生论文 > 内科论文 > 心血管内科论文 > 基于多特征分支卷积神经网络的心电图分类算法

基于多特征分支卷积神经网络的心电图分类算法

2024-04-16 5 上传者：管理员

摘要：我国心血管疾病发病率、病死率呈逐年上升趋势。但由于心电图数据规模大且繁杂，临床医护人员在心电图筛查时，工作负担大且容易出现误诊或者漏诊的情况。基于此，利用CPSC-2018 12导联数据，提出了一种基于多特征分支卷积神经网络的多导联心电信号的智能分类与分析。首先，将CPSC-2018 12导联数据分为9个类别，基于12导联推导出8导联心电信号并分别提取局部特征。然后，通过双向GRU编码和注意力机制计算出不同类别的注意力权重向量，并将特征信息串联融合成特征向量，从而实现多导联心电图分类。实验结果表明：在验证集上取得了较好的分类效果，正常类别的F1值达到81.2%，平均F1值达到84.2%。特别地，在识别房颤（AF）和右束支传导阻滞（RBBB）这两类别心律失常时F1值分别达到95.1%和93.1%。

关键词：
GRU网络
卷积神经网络
心律失常
心电图
注意力机制
加入收藏

心血管疾病（CVD）死亡率高，发病率在世界各地分布不均匀，低收入和中等收入国家受到的影响尤为严重。尽管在心血管疾病防治方面取得了一些成就，但心血管疾病造成的影响仍然很大，防控工作面临重大挑战[1,2,3]。

心电图分析是诊断心血管疾病的重要依据。而且可以理解的是，大量与心脏活动有关疾病的心电图也包含了大量的信息。12导联心电信号包含了更完整的信息。然而，面对海量的心电图数据，完全依靠专业的心电专家诊断显然是不现实的。此外，人为诊断难免会遇到各种突发因素，即便是心脏专家的检测也有可能出现误诊、漏诊[4,5]。

深度学习通过使用多层神经网络，可以有效地表达复杂的非线性函数，并直接从原始信号数据中学习特征，无需人工进行特征提取和选择。然而，深度学习需要足够的数据来准确地适应问题中复杂的映射关系。随着动态心电技术的发展，心电信号数据的快速增加，如此深度学习在智能心电识别中需要的数据量也完全得到了满足。Elhaj等[6]提出了离散小波变换（DWT）进行特征提取，用主成分分析法（PCA）进行特征降维的方法，提取有效特征，显著提高了识别精度。而Li等[7]提出了一种基于多域特征提取的心电识别系统。将改进的小波阈值法应用于心电信号预处理，以去除噪声干扰。Martis等[8]在特征提取阶段提出了一种新的滤波方法，该方法首次将PCA与ICA结合使用在PNN浅层概率神经网络上，达到98.91%的准确度[9]。Karimifard等[10]提出了一种形态学心律失常检测方法，该方法基于高阶统计的模型（HOS）。然而临床采集的心电信号长度是可变的，可能包含混合的心律失常情况。对于深度学习能否对变长心电信号进行准确分类的问题，还没有得到研究[11,12]。因此，本文开发了一种基于注意力机制的并行卷积深度学习网络，可用于对任意可变长度的心电信号进行分析，从而提高对多导联心电图分类的准确性。

1、数据预处理

本文中使用的数据集为2018年中国生理信号挑战赛（The China Physiological Signal Challenge,CPSC-2018）所发布的数据集。包括以下9类样本，其中：N代表正常类别、AF代表房颤、I-AVB代表一度房室传导阻滞、LBBB代表左束支传导阻滞、RBBB代表右束支传导阻滞、PAC代表房性期前收缩、PVC代表室性期前收缩、STD代表ST段压低、STE代表ST段抬升。数据长度最长为60 s，最短为6 s。在公开的6 877条数据中划分了测试集和训练集。数据的采样率为500 Hz[13]。在进行实验之前，需要对实验数据进行预处理，包括数据剔除、数据降采样、数据增强、等长处理等。整个预处理的过程如图1所示。

图1 心电数据预处理

1.1 数据剔除

在12导联中标准导联（Ⅰ，Ⅱ，Ⅲ）与加压单极导联（a VR,a VL,a VF）之间关系可以用以下公式表示

从式（1）～式（5）可以得出，12导联心电信号中a VR,a VL,a VF，Ⅲ这4条导联信号均可由Ⅰ导和Ⅱ导推导而出，所以在转化为特征向量时这4条导联与其他导联是线性相关的。故而在本研究中采用Ⅰ，Ⅱ，V1～V6这8条导联进行研究，可以在保留有效特征信息的情况下将原始信号的数据量降到原来的2/3。本文采用Ⅰ，Ⅱ，V1-V6导联数据进行降采样。

1.2 数据降采样

CPCS数据集中的信号采样率为500 Hz，这意味着一段60 s的信号中将存在30 000个采样点，这需要较深的网络结构才能学习到完整特征。所以，本文使用采样算法将数据点降为原来的一半，这样可以加快训练速度，然后进行后续处理。

1.3 数据增强

CPSC数据集中不同的异常信号样本分布并不均匀，最多的（RBBB）类别样本有1 695条而最少的（STE）类别样本只有202条，在数据不平衡的情况下，模型可能会更倾向于预测具有更多样本的类别，而忽略样本量较小的类别，这可能会导致模型的准确性下降。因为模型没有足够的数据来学习较小类别的特征，所以，本文采用数据重采样的方式来应对此问题。

1.4 等长处理

CPSC数据集合中，数据长度从6～60 s不等，而神经网络擅长处理等长的信号，所以重采样之后的每条信号需要进行等长处理。等长处理的具体操作是将所有不足60 s的数据用0补齐至60 s，超过60 s的信号则从60 s处裁剪。

1.5 归一化处理

归一化后的心电信号保留了原始信号的基本特征和形态，同时消除了信号幅度和长度的影响，使信号处理更加方便和准确。而且，经过归一化处理后的心电信号具有相同均值和标准差。因此，归一化后的心电信号更容易进行比较和分析。此外，归一化可以使不同长度和幅度范围的心电信号在模型训练中更容易收敛，有助于提高模型的性能。另外，数据集中心电信号的长度不一致，为了训练方便，将所有信号统一补零到相同的长度60 s。为了更好地提取心电图的特征，将心电图做标准化处理，采用的方法是Z-score方法[9]，归一化的计算公式为

式中：为标准化后的数据；μ为心电数据的均值；σ为心电数据中的标准差。对心电数据进行标准化处理之后，所有心电数据的幅值大小都介于0～1之间，这样处理过后的数据更加稳定，有利于算法的特征提取和分类。

2、基于多特征分支卷积神经网络心

电分类算法

2.1 卷积神经网络概述

卷积神经网络（CNN）是一种将一般矩阵乘法运算转化为用卷积算子进行运算的神经网络。它特别适用于处理类似网格的结构化数据，例如时间序列和图像数据。二维卷积运算涉及一个小矩阵（核或滤波器）和输入数据的接受域之间的点积，生成一个新的输出。该操作可以从图像等二维数据中提取特征。类似地，一维卷积运算可以从一维数据（如时间序列）中提取特征。

用于图像处理的二维卷积神经网络是比较基础的。所以拿二维卷积来举例，输入层中输入一张二维的图像数据I，二维的卷积核K的大小为m×n。对其进行卷积运算，则二维卷积运算可表示为

卷积运算的3大特性为：稀疏连接、参数共享和平移不变性。与多层感知机不同，多层感知机中的网络通过矩阵乘法将每个输出单元与每个输入单元连接起来，卷积网络具有稀疏连接，允许模型学习更少的参数，同时仍然在学习任务中表现良好。

卷积网络中的平移不变性保证了学习到的特征对于输入数据的空间变换（例如旋转或平移）是不变的。参数共享是指对于输入特征图中的每个位置，卷积核的参数是相同的，因为它只需要学习一个卷积核里的参数。参数变少降低了过拟合的风险，并且也减小了模型的计算复杂度，使得模型更加轻量化和高效。

CNN中的池化操作用于降低卷积层生成特征图的空间维数。这有助于防止过拟合和减少网络中的参数数量。池化操作通常紧跟在卷积层之后，将卷积层的输出特征图作为池化的输入，再将池化后的特征图作为下一层的输入。池化操作通常有最大池化、平均池化等多种形式，最大池化的结果是池化范围内所有数字的最大值。最大池化可以有效地提取特征图中最显著的特征。平均池化的结果是池化范围内所有数字的平均值。图2为最大池化和平均池化的过程。它可以平滑特征图中的特征，从而减少噪声和一定程度上避免过拟合。池化操作的一个重要参数是池化区域的大小和步幅。

图2 最大值池化和均值池化

池化区域的大小决定了在特征图上进行池化的区域大小，而步幅决定了池化操作的重叠程度。

2.2 GRU网络概述

GRU与LSTM相似之处在于它们使用门来调节信息流，但GRU的不同之处是依靠隐藏状态来传输相关信息。而且GRU与LSTM网络相比减少一个门，计算步骤也更简单[14]。GRU的基本结构如图3所示，在时刻t,GRU将当前输入和t-1时刻的隐藏状态作为输入，输出激活[15]。

zt是更新门，其内部计算可由式（8）表述

将t时刻的输入xt和t-1时刻的隐藏状态ht-1与相应的权重参数相乘后相加，再经过sig‐moid函数归一化处理，更新了门定义前面记忆保存到当前时间步的量。

rt为复位门，新的输入信息与上一时刻的记忆相结合的计算公式为

代表候选隐藏层状态，包含t时刻xt的信息和t-1时刻隐藏状态ht-1保留下来的部分。其计算公式为

ht为最终的隐藏状态对t-1时刻隐藏信息的部分遗忘，对当前的隐藏信息通过更新门进行部分保留。其计算公式为

图3 GRU基本结构

2.3 注意力机制

注意力机制是一种模仿生物学中观察到的行为技术，在生物学中，更多的资源被分配到需要更多注意力以获得更详细信息的领域，而较少的资源被分配到不相关的信息上。这种机制是一种内部经验与外部感知相结合的方式，可以提高特定区域的观测精度。基于注意力的LSTM网络在自然语言处理、语音识别、图像处理、视频处理等领域都有广泛的应用[16]。注意力机制可以分为全局注意力和局部注意力两种。全局注意力指的是模型对于所有输入信息都进行关注，适用于输入信息较少的场景；局部注意力则是模型仅仅关注输入信息中与当前处理相关的部分，适用于输入信息较多的场景。神经网络中的注意机制，是一种自上而下的注意机制，以端到端、目标导向的方式进行学习。它对模型中的各个元素赋予不同的权重，增加有影响的参数的权重，降低无关信息的权重。注意力机制的优势包括注意力机制强化模型对关键信息的关注图、提高模型的泛化能力、擅长处理长序列问题[17]、对抗噪声和攻击。图4为注意力机制原理。

图4 注意力机制原理

重要程度分数可以表述为

式中：ht是第t个时刻解码的隐藏状态；hs是表示编码的隐藏状态；W是一个需要学习的矩阵，且在整个过程中，都使用同一个W，在求得得分之后可以求得Attention的权重为

再将权重与编码器中的隐藏状态相乘求得到注意力权重向量，即为图4中的C1,C2。

注意力向量可用式（15）描述

式中：ct与ht结合的过程，对应C1和H7,C2与H8的结合过程。

2.4 并行卷积心电分类模型

引入8分支并行卷积模型思想，同时提取8条导联的特征，每条网络只负责提取对应导联特征，利用所需参数更少、学习效果更佳的双向GRU网络，将GRU编码后的特征输入注意力模块中计算注意力权重向量，最后，将每个导联分支提取的特征融合，用Softmax函数分类。本模型整合8个导联的损失和融合特征以后的损失进行同时优化，进一步提高了模型的性能。所提出的多特征分支融合网络（MLBFNet）如图5所示，由3个部分组成：1）多个导联特异性分支，用于学习多导联ECG的多样性；2）跨导联特征融合，将各分支输出特征进行拼接，学习多导联心电图的完整性；3）各分支和级联网络的多损失协同优化。

图5 并行卷积模型结构

2.4.1 一维卷积模块

一维卷积可以提取部分特征，该层主要由5个卷积块组成，用于提取局部心电特征。卷积块的具体参数如表1所示。每个卷积块中包含了大小为（3*8）和（24*8）的卷积核，由于心电序列中的特征需要兼顾前后特征，因此，先用（3*8）的卷积核提取特征，再用（24*8）大小的卷积核联合前后特征。均值池化的区域大小为2，将提取到的特征维数降维。

表1 每条独立卷积分支的结构参数

2.4.2 双向GRU层

每条卷积神经网络的输出特征输入到双向GRU层后，可以实现对卷积层提取出的特征进行强化。双向GRU的结构如图6所示，前向GRU层和后向BRU层构成了双向GRU，形成一个新的隐藏状态序列。最后，将合并后的隐藏状态序列作为输入，进行分类或预测。在本章的实验中，将双向GRU层设为8个单位。

2.4.3 注意力模块

经过双向GRU网络编码的特征向量输入到注意力模块后，每一个的特征将计算出与之相对应的权重值。先计算出输入类别特征和预测类别注意力得分，分数是计算注意力权重的必要条件，然后将注意力权重与每一刻对应的隐藏状态求加权和，得到注意力权重向量。通过连接层连接注意力权重向量将重要的信息集中到输出序列中进行异常心电信号分类。

图6 双向GRU内部结构

2.4.4 特征融合模块

每条独立的卷积分支分别学习到8个导联各自的特征值，最后，通过拼接层将8个导联学习到的特征拼接成一条特征向量用于分类。

2.5 多特征分支网络算法流程

图7为本文提出的多特征分支并行卷积算法实现流程图。

图7 并行卷积模型算法流程

首先，在输入数据后对数据进行一系列预处理，包括数据剔除、数据降采样、数据增强、等长处理归一化处理、数据划分等。模型开始训练以后，初始化并行卷积网络参数，对划分好的数据集提取特征并计算损失，根据损失，利用反向传播算法优化参数，判断迭代次数来决定学习率的大小，20轮以内学习率为0.1,60轮以内为0.01，大于60轮时衰减为0.001。模型收敛后保存训练好的参数用以对测试集的预测。

3、评估指标

本文研究的心电图分类为多分类问题，因此，采用精准率、召回率、F1分数作为模型的评价指标。

精准率：高的准确率表明模型或系统能够准确地识别相关信息，而低的准确率表明模型或系统在结果中包含了大量不相关的信息。计算方法为真阳性数量（TP）除以真阳性数量（TP）和假阳性数量（FP）之和。公式定义为

召回率：高召回率表明模型或系统能够识别出大量相关信息，而低召回率表明相关信息正在被遗漏。计算方法为真阳性数量（TP）除以真阳性数量（TP）和真阴性数量（FN）之和。召回率的公式定义为

F1分数：F1分数的计算是精准率和召回率的调和平均值，F1分数的取值范围为0～1，数值越高性能越好。F1分数公式定义为

4、实验结果

图8为本文所提模型训练的损失函数曲线，在100个epoch后收敛。可以看出，在第20个和第60个epoch时，曲线由于学习率的衰减加速收敛，说明学习率衰减方案是一种行之有效的方法。

表2为所提模型在测试集上的混淆矩阵。表3为该模型的分类性能。

从表2中可以得出，在使用了并行卷积模型后对房颤类（AF）和右束支传导阻滞类（RBBB）分类的F1值可达到0.951和0.931，对正常的类别（Normal）识别精度有了显著的提升，正常类别的F1值可以达到0.812。

图8 训练损失函数曲线

表2 所提模型在测试集上的混淆矩阵

表3 本模型的分类性能

将提出的多特征分支模型与现有的基于CPSC2018的12导联ECG数据集开发的心电图分类模型进行性能对比。对比结果如表3所示，其中CNN-LSTM为He等[18]提出的残差卷积模块和双向LSTM进行特征提取的分类模型；ATI-CNN为Yao等[19]提出的基于注意力机制和LSTM网络的卷积神经网络模型；ATIGRU-CNN为Zhang等[20]将基于注意力机制的卷积模型中的LSTM层替换为GRU层的模型，该模型取得了官方竞赛的第一名。

为了确保公平比较，所有的模型均使用同一个公共数据集进行训练，并在划分好的测试集上进行评估。同时，采用本章提出的预处理操作对训练数据集进行预处理；然后，输入3个对比模型；最后，对这些模型的预测概率进行平均，得到最终概率。如表4所示，本文方法除了对6种心电的平均筛选能力优于现有方法，也比官方公布的第一名模型的F1平均分高了1.7%。所提模型对Normal,LBBB,RBBB和STE的诊断优于其它模型。其中，最显著的优势在于对AF类和STE类的识别，F1值比之前表现最好的两组分别提高了1.5%和2.8%。所提出的模型在识别大多数心律失常方面取得了明显的优势。

表4 所提模型与其它模型的F1值比较

5、结语

本文创新性提出使用12导联中的8个导联数据作为识别样本，实现异常心电分类，将现有的使用12支并行卷积网络缩减为8支，并在卷积层后加入注意力模块。所提出的模型中，每一条卷积分支中包括卷积块、双向GRU层和注意力模块，利用8条独立的卷积网络对8条导联分别提取各自特征，最后，将各自提取的特征融合成一个特征向量，进行心电信号分类。实验结果表明：本模型在识别房颤（AF）和右束支传导阻滞（RBBB）这两类心律失常时，F1值都可以分别达到95.1%和93.1%，在正常类别的F1值也可达到81.2%，平均F1值也达到了84.2%。本文模型与现有的模型对比，分类性能超过了官方公布的2018年比赛的第一名（0.835）。

参考文献:

[1]中国心血管健康与疾病报告编写组.中国心血管健康与疾病报告2020概要[J].中国循环杂志,2021, 36(6):521-545.

[4]杨丰,余英林.小波变换在心电信号滤波处理中的应用研究[J].生物医学工程学杂志,1997, 14(4):317-320.

[15]王相月,赵利辉.基于多阶段特征选择和CNN-GRU的网络入侵检测模型[J].中北大学学报(自然科学版),2024, 45(1):66-73.

[16]李敏学.基于注意力机制的图像显著区域提取算法分析与比较[D].北京:北京交通大学,2011.

[17]王红,史金钏,张志伟.基于注意力机制的LSTM的语义关系抽取[J].计算机应用研究,2018, 35(5):1417-1420.

基金资助:国家重点研发计划资助项目(2018YFC2000701);中国博士后科学基金资助项目(2021M692400);山西省基础研究计划资助项目(202203021221017);

文章来源:王建荣,程伟,邓黎明,等.基于多特征分支卷积神经网络的心电图分类算法[J].测试技术学报,2024,38(02):161-169.