91学术服务平台

您好,欢迎来到91学术官网!站长邮箱:91xszz@sina.com

发布论文

论文咨询

基于轻量化网络的帕金森步态识别方法

  2025-04-11    42  上传者:管理员

摘要:为了提高帕金森步态的识别效率并保持高识别精度,提出了一种基于轻量化帕金森步态识别方法—多头量化时域卷积网络(MQ-TCN)。用TCN层替换深度可分离卷积中的逐通道卷积,并部署TTQ算法,减少模型的参数量和参数复杂度。其次,该研究还分析了帕金森步态数据的冗余性,在略微损失识别精度的前提下大幅降低了模型训练所需的存储空间,进一步提升了模型在轻量设备中的可部署能力。实验结果显示:改进的MQ-TCN平均识别精度达到94.9%,参数量仅为目前最小帕金森步态识别模型的5%,不但保持高效的识别精度,还大幅度降低了模型的参数量与参数复杂度,为后续帕金森步态识别工具在轻量设备上的部署提供了参考依据。

  • 关键词:
  • 参数量化
  • 异常步态识别
  • 时域卷积网络
  • 模型压缩
  • 轻量化卷积
  • 加入收藏

帕金森病作为一种典型的慢性进行性神经系统病症,目前已成为世界第二大常见疾病[1,2]。早期帕金森病病症较轻、医师难以诊断,患者不能及时接收治疗,导致确诊时病情等级较高。因此,提出一种能够区分帕金森病情的诊断工具有重要意义[3,4]。

帕金森病患常会伴随运动迟缓、震颤等症状,并出现帕金森步态。定量分析步态信息可方便在研究中评估运动模式,揭示步态与帕金森病情潜在关联。在帕金森步态定量分析中,会用到光学设备和运动传感设备[5]。光学设备采集的光学信号是一种结构化数据,包含了大量与空间相关的特征,如轮廓、纹理特征等[6]。但是光学设备非常依赖光照条件且灵活性差。而运动传感设备(如加速度计、压力传感设备等)具有实时性强、采集方便与采集信息丰富等优点,在疾病步态诊断领域有更多应用空间[7,8]。

压力传感设备能有效捕捉足底压力变化,以进行异常步态的分析。现有基于压力传感信息采集的帕金森步态识别方法主要有以下几种,文献[9]与文献[10]利用时频分析方法将时域信号转变频域表示,将一维时域信号转变为二维时频图,并使用二维卷积神经网络提取时频特征,但时频转换过程存在不确定性的限制,可能导致模型出现识别误差。文献[11]提出使用多分支一维卷积神经网络(CNN)提取单通道局部步态特征,但是卷积神经网络无法捕捉时序中的长期依赖关系。文献[12]搭建的双路长短时记忆网络能够捕捉时序中关联特征,但长短时记忆网络参数量较大,需要长时间训练模型与参数调优。文献[13]将Transformer算法用于步态特征提取,利用多头自注意力机制提取时域中位置依赖关系,该算法具有更强的特征提取能力,但模型搭建所需的参数量高达200万。上述方法都完成了识别任务,但若要将模型移植到轻量化移动设备中,均存在计算复杂度高、模型规模大等不足之处。

本文利用TCN出色的长时序依赖特征提取能力,结合深度可分离卷积与训练的三元量化(trainedternaryquantization,TTQ)算法提出的轻量识别模型(MQ-TCN),旨在保持高效识别精度的前提下,加快模型的推理速度,降低模型的参数规模,方便将模型应用于移动设备。同时,分析压力信号相似度和流动频率分布规律,剔除原始数据中冗余数据,使用高质量数据训练模型,既减少模型训练时间和对硬件资源的需求,也保持了模型对帕金森步态的识别精度。


1、MQ-TCN模型


1.1整体网络架构

帕金森步态识别网络主要由多头深度TCN卷积、逐点卷积层、全局平均池化层组成,如图1所示。每个深度TCN卷积通道由多个TCN模块构成,单个TCN模块由多网络子层与量化模块构成。在各TCN模块中,待量化层中的全精度参数被量化模块量化为三元参数,形成三元精度层。

1.2多头深度TCN卷积

为了解决传统CNN对单通道独立特征提取方面的不足和无法捕捉长时序依赖特征的缺陷,本文的多头深度TCN卷积设计如下:将多个TCN模块依次嵌入深度可分离结构的深度通道,不断扩张TCN模块的空洞率与扩张特征提取通道,扩大模型对时间依赖特征的感受野和提升模型的表达能力,提取单通道中更长的时序特征。

本文的TCN模块包含2个TCN层和2个TTQ量化模块。为方便TTQ算法对全精度参数的量化过程,本文将传统TCN层中权重归一化(weightnormalization,WN)算法适应性优化为批量归一化(batchnormalization,BN)算法,并将ReLU激活函数替换为灵活度更高、非线性更强的Hswish激活函数。改进的TCN模块如图2所示,TCN层由卷积核大小为K,空洞率为d的CNN层、BN层、Chomp层和H-swish激活函数构成。本文只针对参数量较高的CNN层进行量化。

图1模型整体结构

图2改进的TCN模块

1.3TTQ算法

TTQ算法通过引入1条量化流、2条梯度流与2个可学习的缩放因子Wn与Wp学习三元量化分布。算法的整体流程为,全精度参数在前向传播中被量化为高稀疏度的三元参数,并在三元损失的作用下通过梯度流1与梯度流2更新缩放因子与全精度参数。TTQ量化算法如图3所示。

图3TTQ量化算法

前向传播:首先,全精度参数w经过标准化模块后,将所有参数值统一缩放至(0,1)之间;然后,稀疏因子t(0<t<1)根据当前网络层权重分布适应性计算出划分阈值Δl;最后,通过式(1)根据阈值Δl将参数划分为只包含[-1,0,1]的参数组合,并与缩放因子Wn与Wp结合得到三元参数[-Wn,0,Wp]

反向传播:首先,使用前向传播中生成的三元参数wt计算损失,得到wt的梯度∂loss/∂wt。然后,根据式(2)~式(4)得到全精度参数梯度∂loss/∂w与缩放因子Wn,Wp的梯度∂loss/∂Wn,∂loss/∂Wp。

每一个待量化的网络层都会被TTQ算法分配独立缩放因子,各层参数的更新由特定缩放因子完成,缩放因子的更新独立进行。因此,在图3中TTQ算法作用下,缩放因子量化全精度参数产生的三元参数将会影响全精度参数更新,全精度参数更新也会反向影响划分阈值和缩放因子的大小,使三元分配发生变化,三元参数在多次更新后最终趋于最优表征。

1.4数据冗余性

考虑到压力信号采集系统采集点数多且密集,邻近信号点之间的冗余性成为了需要被研究的问题,因此,本文从数据相似度和数据特征量出发,分析数据冗余性。

首先,本文选用皮尔逊相关系数算法求解信号的相关系数矩阵,反映多个数据之间的多重共线性相关系数通常用符号r表示(r∈(-1,1)),当满足|r|≥0.8认为2条信号之间存在极强相关性。本文将原始信号划分为c个时间窗口A={a1,a2,…,ac},然后计算每个窗口的相关系数矩阵V={v1,v2,…,vc},统计相关系数矩阵V中满足|r|≥0.8的信号出现次数,统计结果放在相似度矩阵Fm×m中。

其次,文献[14]中对压力转移的研究表明,压力信号的波动频率与波动幅度与该信号包含的特征量成正比,压力信号点产生的数据波动频率越高且幅度越大,会蕴藏更多步态特征。统计相邻数据帧中满足波动幅值信号点的转移频率,能直观反映各信号点的特征量。方法如下:对相邻数据帧xt与xt+1按照压力大小排序,产生信号点排序序列Sort(xt)和Sort(xt+1)。按照信号点的顺序,在排序序列中查找信号点位置location(St,i)和location(St+1,i),其中St,i代表第t帧第i信号点。使用数据平均值P判断波动幅值,统计信号St,i与St+1,i满足location(St,i)≠location(St+1,i)和|St,i-St+1,i|≥t·P(t为缩放系数)出现的次数。统计结果放在特征量矩阵W1×m中。

最后,利用相似度矩阵Fm×m可以分析信号相似度得到信号点高相似度分组,再结合特征量矩阵W1×m从高相似度信号组中挑选出具有最低特征量的信号,最终定位出高冗余性、低特征量的数据。


2、实验


2.1数据集

本文使用了PhysioNet官网提供的帕金森足底压力数据集[15],数据集中含了93名病情程度不同的帕金森病患者和73名健康志愿者的行走数据,共计305段行走记录。该数据集使用传感器在16个压力信号点以100Hz的采样频率采集人行走时足底不同点位的压力信号值,并记录双足所有采样点压力总和。压力信号点分布如图4所示。

图4压力信号点分布

2.2训练细节为了研究量化算法对模型带来的影响,本文采用消融实验将模型分为非量化网络(multichanneltemporalconvolution,M-TCN)与量化网络(MQ-TCN)。在M-TCN模型的训练实验中,使用了初始学习率为0.001的Adam优化算法。在MQ-TCN网络的训练实验中,分别使用学习率为0.01、0.001和0.05的Adam算法优化全局参数、全精度参数和三元参数。所有实验结果均采用十折交叉验证进行评估。

实验中数据的分窗长度为100帧,滑动窗口长度为50帧。所有实验都是基于Pytorch深度学习框架。实验环境为Ubuntu16.04.7LTS,NVIDIATITANXp。

2.3消融实验

为了验证模型轻量化方法的有效性,统计了本文模型与文献[11]提出的1D—CNN模型、文献[12]提出的LSTMCNN模型、文献[13]提出的Transformer模型以及文献[16]中传统机器学习算法如多层感知(MLP)、随机森林(RF)和朴素贝叶斯(NB)性能的对比结果,在表1包含了各方法敏感度(sensibility,Se)、特异性(specificity,Sp)、准确率(accuracy,Acc)与参数量(Params)等性能指标的对比(注:标准差(standarddeviation,SD))。

表1网络性能对比

由表1可知,基于Transformer的识别模型虽然达到了95.2%的识别精度,但参数量达到200万,其他深度模型虽然能达到识别帕金森步态的目的,但参数量也普遍偏高。本文提出的M-TCN模型的识别精度为95.1%与目前最优的模型精度相似,且仅需2.25万模型参数量,经量化后的MQ-TCN模型精度下降到94.9%,但仍高于大部分其他深度模型。此外还可以观察到,MQ-TCN模型的敏感度与特异性均高于M-TCN模型,这可能是量化降低了模型过拟合的结果。

表2分别给出了MQ-TCN模型中CNN层、多头深度TCN卷积层和整体模型的总参数量、零值个数和稀疏度。由表2可以观察到,量化算法使3个卷积层稀疏度达到90%,多头深度TCN模块稀疏度达到82%,使整体模型稀疏度达到39%。量化实验结果显示,TTQ算法使量化层的参数稀疏度提升,大幅降低参数复杂度,且能保持优秀的识别精度。

表2各层参数量、零值个数以及稀疏度

2.4数据冗余性实验

为了形象化分析冗余数据,本文首先将1.4小节得到的矩阵做以下处理:将相似度矩阵归一化,使矩阵中信号相似度小于0.5的数值置零。然后,根据归一化之后的相似度矩阵在足底信号点之间连线,使相似度高的信号点之间产生连接,并将相似度标注在连线旁。最后,根据特征量矩阵中不同信号点的特征量标注在对应信号点旁,最后生成的足底相似度与特征量分布,如图5所示。

图5足底相似度与特征量分布

根据图5中相似度连接,本文将8个信号点划分为相似组1,相似组2和相似组3,组内信号被认为含有大量冗余特征,如图5矩形虚线框。各组中特征量最高的信号点被标注为灰色,代表相似组内最具有代表性的信号点。结合图5足底相似度与特征量分布,分别从3组信号点中剔除特征量相对较低的冗余信号点2、3、5、6和8,得到消融数据1、4和7,足底压力流动路径被简化为图5中1-4-7的虚线轨迹。为了对比数据冗余度挑选实验结果,本文分别使用消融后数据和原始数据训练M-TCN模型与MQTCN模型,实验结果被统计在表3中。

表3信号挑选实验结果

从表3中可以看到,使用消融数据训练的MTCN模型达到了94.6%的平均精度,MQ-TCN模型达到94.3%的平均精度。消融后的数据与全部数据的模型表现基本相同,这说明经过数据冗余性分析得出的数据具有高代表性,数据中蕴含更多模型识别所需的步态特征,因此,使用更少的数据输入并不会使模型性能显著下降,而且减少了模型的训练压力。


3、结束语


为了有效降低模型训练与识别压力,提升模型泛化能力,本文提出了一种基于TCN的轻量级帕金森步态识别模型,该模型能同时提取单通道与多通道信号长时序依赖关系。然后,采用两种数据挑选方法对压力信号进行统计分析,在剔除高冗余性数据后得到的高质量数据也使模型保持对帕金森步态特征的高效识别能力。本文提出的模型不仅大幅降低了模型参数规模与复杂度,还能对数据表现出强大的鲁棒性,保持了与复杂网络相媲美的性能水平。


参考文献:

[6]张传博,李林福,陈建军,等.基于剪切波变换的光学元件表面缺陷检测方法[J].传感器与微系统,2023,42(6):116-119.

[7]吴文杰,朱耀麟,梁颖.基于WiFiCSI的多特征融合的步态识别[J].传感器与微系统,2023,42(3):144-147,151.


基金资助:国家自然科学基金资助项目(12201075);


文章来源:郭坛,时文雅,郇战,等.基于轻量化网络的帕金森步态识别方法[J].传感器与微系统,2025,44(04):143-147.

分享:

91学术论文范文

相关论文

推荐期刊

网友评论

加载更多

我要评论

传感器与微系统

期刊名称:传感器与微系统

期刊人气:4119

期刊详情

主管单位:中国电子科技集团公司

主办单位:中国电子科技集团公司第四十九研究所

出版地方:黑龙江

专业分类:科技

国际刊号:2096-2436

国内刊号:23-1537/TN

邮发代号:14-203

创刊时间:1982年

发行周期:月刊

期刊开本:大16开

见刊时间:1年以上

论文导航

查看更多

相关期刊

热门论文

【91学术】(www.91xueshu.com)属于综合性学术交流平台,信息来自源互联网共享,如有版权协议请告知删除,ICP备案:冀ICP备19018493号

微信咨询

返回顶部

发布论文

上传文件

发布论文

上传文件

发布论文

您的论文已提交,我们会尽快联系您,请耐心等待!

知 道 了

登录

点击换一张
点击换一张
已经有账号?立即登录
已经有账号?立即登录

找回密码

找回密码

你的密码已发送到您的邮箱,请查看!

确 定